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لايسمح باعادة إصدار هذا الكتابء أو نقله في أي شکل أو وسيلة» 
سواء أكانت إلكترونية أم يدوية أم ميكانيكية» با في ذلك جميع أنواع تصوير الستندات بالنسخ» أو 
التسجيل أو التخزين» أو أنظمة الاسترجاع. دون إذن خطي من المركز بذلك. 
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القد مه 


مقدمة 

الحمدلله رب العالین» والصلاة والسلام على آشرف المرسلين» وأفصح من نطق 
بالضاد سیدنا محمد النبي الامي الأمين» وعلى آله وصحبه» ومن اهتدی بهدیه إلى يوم 
الدين» وبعد... 

إن التطور الحادث في جال الذكاء الااصطناعي في علاقته بالعلوم الانسانية والعرفية 
قد عزز من حركة اللسانیات الحاسوبية تجاه الواقع الجتمعي إذ أصبحت رکنا ساسا 
في صناعة مجتمع المعرفة» فضلا عن أن آول عنایتها نمذجة الاستعال الانساني للغة ببناء 
التطبیقات التي تسهم في جال فهم اللغة المكتوبة والنطوقة للحاسوب. 

وتقتضي تقنیات التعلم VI‏ - لا سيم| ذات نمط التعلم الوجه - في مامتها للغة 
الطبيعية تمثيل اللغة في إطار هندسی یتفق وطبيعة العطیات الرياضية التي تنطلق منها 
خوارزمیات التدریب cll ees‏ الاحصائية للغة. l‏ 

ولا كان النحو أو الترکیب هو السوول بصفة آساسية عن توفير العطیات اللازمة 
للتحلیل اللغوي الأعمق» فضلا عن استناده إل سس النطق الریاضی ف التمثیل 
أو التجرید. فقد جاءت الدراسة el ie p‏ (البنك الشجري النحوي: باز وتوظیفه 
في إطار تقنیات الذکاء الاصطناعي) محاولة لبناء مدونة موصّفة Úno‏ نحويًا للغة 
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العربية الفصحی العاصرة» یمکن توظیفها في بناء تطبیقات النمذجة النحوية للغة 
العربية باستخدام تقنیات الذكاء الاصطناعي. 

ونظرا لتعدد آنماط العربية الفصحی» فان البحث یقتصر على نمط العربية الفصحی 
العاصرة لا سيا لغة الصحافة الالکترونية؛ لکونا الأكثر انتشارًا واستعالا في الواقع 
اللغوي العاصر . 

ويستمد البحث مادته اللغوية من موقع إسلام آون لاين الإلكتروني في الفترة الزمنية 
من 5١٠٠م‏ إلى ۲۰۱۰م وهي الفترة التي حظي فيها موقع إسلام آون لاين بترتيب 
متقدم بين مواقع شبكة الإنترنت - من حيث عدد زائريه - وفقا لتصنيف أليكساء 
وذلك مذ إنشاء إدارة الموقع بالقاهرة حتى قبيل الخلاف الحادث بين الشركة المصرية 
المنتجة للموقع«ميديا إنترناشونال» وجمعية البلاغ القطري المالكة للموقع ce‏ عام 
٠م‏ والتي أدت إلى إغلاق موقع إسلام أون لاين» ونقل تحريره إلى قطر. 

ويقوم البنك الشجري النحوي على النهج الوصفي في التحليل» حيث يعكس أنواع 
العلاقات التركيبية في النظام الجملي للغة. ويتنوع مجال البحث ما بين الطرق المنهجية في 
الدرس النحوي التي ترسخت في علم اللغة الحديث مثل لسانيات المدونات Corpus‏ 
Linguistics‏ التي dai‏ منطلقا للتحليل النحوي. وعلم اللغة الإحصائي الذي يناط 
به وصف البیانات اللغوية وصفا إحصائياء وعلم اللغة الحاسوبي Computational‏ 
Linguistics‏ أو معالحة اللغات الطبيعية Natural Language Processing‏ التي 
تهدف إلى محاكاة اللغة البشرية - عبر تقنيات الذكاء الاصطناعي - بوضع p‏ 
حاسوبية للإدراك الإنساني. 

وسعيًا وراء بلوغ الهدف المنشود من الدراسة» فقد اقتضى الكتاب أن gl‏ في تمهيد 
وخمسة فصول» وخاتمة» وذلك على النحو التالي: 

التمهيد: يعرض مفهوم البنك الشجري النحوي؛ وأهميته على الصعيدين اللغوي 
والحاسوبي» ثم إرهاصات البنوك الشجرية النحوية بشكل عام» ثم يلي ذلك المبادئ 
العامة للعنونة اللخوية. 

الفصل الأول: بناء الدونة اللغوية. ویتناول مفهوم الدونة اللغوية» واستخداماتهاه 
وإرهاصاتهاء ثم اختيار مادة الدونة اللغوية وفق العاییر التي يتم بها اختیار النصوص 


=s 
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ويلي ذلك تبيئتها [p‏ يتناسب مع النظم الآلية» وأخيرًا تجزئة نصوصها؛ لتكون مؤهلة 
للعنونة النحوية eo‏ بعد. 

الفصل الثاني: العنونة بالأقسام الكلامية: ويتناول تقسيم الكلام وأهميته» وكذلك 
الحاجة إليه» ثم مفهوم العنونة بالأقسام الكلامية» وأهميتها في تطبيقات المعالجحة الآلية 
للغة الطبيعية بشكل عام» ثم يعرض الفئات الكلامية العربية المختلفة المستخدمة في 
العديد من التطبيقات» وأخيرا يعرض ناذج من عنونة المدونة اللغوية بالاقسام الكلامية 
في ضوء اختیار الفئة الكلامية التى تناسب الهدف المنشود. 

الفصل الثالث: العنونة بالعلاقات التركيبية. ويتناول تعريف العلاقات التركيبية 
ودورها في تحديد آبنية الجمل» ثم مفهوم العلاقات التركيبية وآهمیتها على الصعیدین 
اللغوي والحاسوبيء ثم الطرق الاجرائية التي تنطلق منها العنونة التركيبية» وآخبرا 
یعرض ناذج من عنونة الدونة اللغوية - عينة الدراسة - بالعنونة بالعلاقات التركيبية 
على الستوی uas‏ والوظيفي. 

الفصل الرابع: ترمیز البنك الشجري النحوي: ویتناول مفهوم الترميز بلغة الترمیز 
القابلة للامتداده ومدی الاستعانة بملف تعریف الوثيقة DTD‏ ومن ثم إمكانية 
التحویل أو ترمیز البنك الشجري النحوي. 

الفصل الخامس: توظیف البنك الشجري في بناء النماذج النحویة: ویتناول منهجية 
بناء النموذج النحوي للغة العربية المعاصرة» موضحًا الخطوات النهجية لبناء النموذج 
النحوي للفئات الوظيفية باستخدام تقنیات التعلم الآلي. 

الخاتمة والنتائج: وتشتمل على آهم نتائج التي توصل إليها البحث. 

وأخيراء يسرني أن آسدي الشکر مخلصا إلى آساتذتي الکرام الأستاذ الدکتور فرید 
حیدر أستاذ علم اللغة بكلية دار العلوم جامعة الفیوم» والأستاذ الدکتور حسن رشوان 
آستاذ الاتصالات والالکترونیات بكلية امندسة جامعة القاهرة» والدکتور خالد 
أبوغالية مدرس علم اللغة بكلية دار العلوم» والاستاذ الدکتور شریف عبده أستاذ 
تکنولوجیا العلومات بكلية امحاسبات والعلومات بجامعة القاهرق والأستاذ الدکتور 
ربیع عبد السلام رئيس قسم علم اللغة بكلية دار العلوم جامعة الفیوم لقاء ما قدموا 
لي من النصائح والتوجیهات السديدة التي عملت بها. كما آنقدم بالشکر الجزيل إلى 
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القائمين على مركز اللك عبد الله بن عبد العزیز الدولي لخدمة اللغة العربية » على ما 
قدموا لي من إرشاد» ودعم متصل في سبیل الحرص على خروج العمل بأعلى جودة 
ce‏ فلهم مني جميعا جزیل الشکر ووافر الامتنان. 


أحمد روبي محمد 
القاهرة ۲۰ فبراير ۲۰۱۷ 


ahmedaruby@ gmail.com 
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التمهيد 


مقدمة: 

يضطلع التمهيد بعرض مفهوم البنك الشجري النحوي» وأهميته على الصعيدين 
اللغوي والحاسوبي» ثم يعرض إرهاصات البنوك الشجرية النحوية بشكل عام مبيتا 
الراحل التدريجية للبناء إلى أن اكتمل على النحو الذي نشهده الآنء ثم يلي ذلك المبادئ 
العامة للعنونة التي يلزم لأي بناء لغوي توصيفي اتباعها سواء أكان على المستوى 
الصوتي أو الصرفي أو النحوي..... وقد جاء هذا التمهيد في ثلاث نقاط رئيسية» وذلك 
على النحو التالي: 

١‏ - مفهوم البنك الشجري النحوي وفوائده. 

۲- إرهاصات البنوك الشجرية النحوية. 

۳- عنونة الدونات اللغوية. 

۱-۳ لماذا عنونة الدونات اللغوية؟ 

۲-۳ المعايير الأساسية لعنونة المدونات اللغوية. 
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۱ مفهوم البنك الشجري النحوي. وفوائده. 

ما زال العقل البشري في حبرة من آمره إزاء اللغة من حيث وظیفتها وماهیتها 
ونشاطها داخل المخ الإنساني»"" إذ تعددت الرژی ما بين كونها ظاهرة اجتاعية أو 
نفسية أو ظاهرة عقلية...وأخيرًا ظاهرة بيولوجية أو عصبية» ومع ذلك فقد عجزت 
هذه الظواهر منفردة عن احتواء إشكالية اللغة» وتقدیم تفسیرات لإدراك کنه اللغة. 

وني محاولة اللسانيين الغربیین للإحاطة بتلك الإشكالية اللغوية» «فقد تم استضافة 
اللغة — نظرًا لتعدد جوانبها - من قبل معظم العلوم الصورية Formal Science‏ التي 
شملت الا حصاء والریاضیات والمنطق» والعلوم الا خبارية Informative Science‏ 
من فئة الانسانیات التي شملت علم النفس وعلم الاجتای وعلم المعرفة» ومن فئة 
الطبیعیات وقد شملت الکیمیاء والطبيعة والفیزیاء والبیو لو OO Loc‏ وقد آثمر هذا 
التضافر بين هذه العلوم المعرفية Cognitive sciences‏ تطورات هائلة في تجسید اللغة 
لا سیا في محاكاتها عبر ميادين الذکاء الاصطناعي التي تقوم على التمثیل الرياضي. 

وإذا كان تطبیق القوانین الرياضية والفيزيائية لادراك الأشياء الممكنة في الحیط 
الخارجي» OP‏ وصف اللغة ریاضٍ مجعلنا قادرين على تجسیدها لدی الحاسوب الذي 
یتخذ الأداء الإنساني نموذجًا له يسعى إلى مناظرته. 

ویقتضی تمثيل اللغة رياضيًا - من خلال الوصف والاستقراء - الاستناد إلى مدونة 
لغوية تعكس الواقع اللغوي» بحيث يمكن استنباط القوانين والأحكام التي ترسم 
الخصائص العامة للظاهرة اللغوية. ومن ثم كانت الحاجة إلى بناء مدونات لغوية 
توصيفية لا سيا التوصيف النحوي باعتباره من العوامل الأساسية لتوفير المعطيات 
اللازمة للفهم الأتوماتي للنصوص اللغوية. 


۰۳ ص۱۹‎ et ۰۵ عربية لمجتمع المعرفة)» عالم العرفت‎ i$ (نبيل)» حجازي. (نادية):الفجوة الرقمية‎ cede )١( 

.۳ الصدر السابق» ص۱۲‎ (Y) 

(Y)‏ ينظر: طعمة (عبد الرمن): میکانیزمات الادراك في العقل البشري: دراسة في آساسیات اللغة والوعي من منظور 
تكنو-عصبي» المؤتمر الدولي الرابع للغة العربية - دبي» ۰۲۰۱۵ ص ۰۱۰ 


— m 
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ويمكن أن يعرف البنك الشجري i Treebank‏ مدونة لغوية توصيفية» تتضمن 
بعض التحليلات النحوية التي تتجاوز بیان مستوى الأجزاء الكلامية إلى الكشف عن 


M mem 


۱-۱ فوائد البنك الشجري النحوي 

۱- تعد البنوك الشجرية النحوية أساسًا هاما لبناء التطبیقات الاحصائية لمعالة 
اللغات الطبيعية Natural Language Processing‏ مثل الحللات النحوية 
Syntactic Parsers‏ وتطبیقات الترحمة UNI‏ وفك اللبس الدلالي Word (SJ‏ 
Sense Disambiguation‏ وغيرها من التطبیقات التی تناظر الأداء الانساني.۲ 

۲- وتعد - LA‏ - آداة للبحث ف الظواهر اللغؤية التي تصف الواقع «s AUI‏ فقد 
یستخدمها اللغویون النفسیون Psycholinguists‏ في إحصاء ترددات بعض الظواهر 
التي ها آثر نفسي في فهم اللغة وانتاجها مثل حصر تکرار آنواع الجمل التكميلية في 
الواقع اللغوي النشود ثم معرفة أي نوع یفضله الانسان؟. ویستخدمها اللغویون في 
البحث عن الأن|ط التركيبية» والأطر التركيبية Subcategorization Frames‏ للأفعال 
والأسیاء وكذلك في الکشف عن الخصائص الأسلوبية للنص التثري أو الشعري. D‏ 

۳- تمثل البنوك الشجرية النحوية me laa‏ من فرضيات النظريات النحوية 
القائمةء فضلا عن إمكانها رسم معام واضحة لنظام الجملة في اللغة الدروستة وتحديد 
خصائص علاقاتها التركيبية» والتي يمكن من خلالها الکشف عن دقائق اللغة وأسرار 
تجلياتها في الاستعمال اللغوي عبر العصور والأمكنة في ختلف التراكات اللغوية. 

-٤‏ تساعد البنوك الشجرية النحوية على تقييم دة الأنظمة امُحَوْسَبة وقياسها 


(۱) قد صك هذا المصطلح - الذي يماثله مصطلح الدونات الموصفة نحويًا - Parsed Corpora‏ العالم اللغوي جيفري 

ليتش Geoffrey Leech‏ في الشانینات من القرن الماضي؛ انطلاقا من شيوع التمثيل النحوي - وقتذاك - في معظم اللغات 

بصورة شجرية. ينظر: 

Holmboe, H. (2004).Nordisk Sporogteknologi, Nordic Language Technology. Museum 
Tusculanums forlag.P.99. 


(2) Holmboe, H. (2004). Ibid.P.99. 


(3) Lüdeling, A and Kyt, A. (2008). Corpus linguistics An International Volum 1. walter de 
Gruyter GmbH& Co. KG. Berlin, Germany.P.225. 


(4) Abeillé, A. (2003). Building and Using Parsed Corpora, Springer. P.xix. 
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2 
0 


باعتبارها معيارًا ذهبيًا .Gold standard‏ ?^ 


۲ إرهاصات البنوك الشحرية النحوية 

ظهرت فكرة البنوك الشجرية النحوية أو الدونات الوضفة نحويًا في اللصف 
الثاني من القرن العشرین؛ نتيجة لظهور منهج العنونة اللغوية الذي كان مطلبًا أساسيًا 
في تحسس نوامیس الظاهرة اللغوية لا سيا الاستعبالات اللغوية في الواقع المعاصرء 
حيث أعلنت جامعة لند Lund University‏ عن شروعها في بناء مدونة توصيفية للغة 
السويدية بقيادة اللغوي أولف تلمان Ulf Teleman‏ وزملائه بالقسم» وذلك Sap‏ 
استقراء خصائص التركيب اللغوي دون تعسف على الاستعال. ۲ 

ثم أعقبت هذه المحاولة عدة محاولات أخرى. منها محاولة اللغوي السويدي إليجراد 
4 الذي عمد إلى توصيف مدونة لانكاستر - IBM‏ للغة الإنجليزية توصيفا 
نحويّاء بهدف GS]‏ تحقيق الشمولية هذه المدونة من حيث توصيفها لكل المستويات 
à AUI‏ وكذلك محاولة جامعة لانكاستر Lancaster University‏ في عنونة مدونة 
لانكاستر - أوسلو Lancaster Oslo Bergen (LOB)‏ للغة الإنجليزية البريطانية» إلا 
آنها تدرجت إلى الآلية في توصیفها. 9( 

وبظهور نظرية العلومات ونشوء الجالات البينية في إطار اللغويات العامة 
اتضحت معام المنهج» واكتملت أركانه» فكان منطلقا أساسيًا في بناء النماذج الإحصائية 
Statistical Models‏ للغة التي تتم في إطار معالحة اللغة الطبيعية لا سيهما أساليب 


(۱) يعود مصطلح «العیار الذهبي «Gold Standard‏ إلى المجال الاقتصادي. إذ يشير إلى النظام المالي الذي يتم فيه 

استعمال الذهب كقاعدة أو معيار لتحديد قيمة العملة وتقييمهاء ثم تعددت دلالة المصطلح إلى الإجراءات العلمية التي 

يمكنها أن تقبل المعايير» فكانت coU gall‏ المعنونة (يدويًا) معيارًا ras‏ لقياس مدى دقة تطبيقات معاحة اللغة الطبيعية 

DES.NLP 

Wissler , L. & Almashraee, M. & Monett, D. & Paschke, A. (2014). The Gold Standard in 

Corpus Annotation. In proceedings of the In Proceedings of the 5th IEEE Germany Students 

Conference 2014. Passau, Germany. P.2. 

(2) Lüdeling, A. & Kytó, A. (2008). Ibid.225. 

(3) Garsid, R. & Leech, G. & McEnery, T. (2013). Corpus Annotation. Second Published by 

Routledge. New York USA. P.10. 

(4) Garsid, R. & Leech, G. & McEnery, T. (2013). Ibid. P.8. 
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التعلّم الإحصائي؛ لذلك انطلقت العديد من الشروعات التوصيفية لختلف اللغات 
في صورة مشروعات قومية» تدعمها الوسسات العلمية. 

ومن أبرز هذه المشروعات ما تدعمه مؤسسة شبكة البيانات اللغوية CLDC‏ 
بجامعة بنسلفانيا: بنك بنسلفانيا الشجري Penn Treebank‏ للغة الإنجليزية الذي كان 
بمثابة الشرارة الأولى في توخيه للمبادئ النظرية والتطبيقية» فقد انطلقت منها العديد 
من البنوك الشجرية الأخرى لكثير من اللغات» وقد أعلن عنه عام ۰۸۱۹۹۲( وبنك 
بنسلفانیا الشجري للغة الكورية Korean Treebank‏ الذي آصدر عام ۱۰۲ Det‏ 
وبنك بنسلفانيا الشجري للغة الصينية Penn Chinese Treebank‏ الذي أصدر 
عن المؤسسة ذاتها عام ۳٠٠۲م“‏ وبنك بنسلفانيا الشجري للغة العربية Arabic‏ 
Treebank‏ الذي آصدر عام ۰۵۲۰۰6 وبنك براغ الاعتمادي للغة العربية Prague‏ 
Arabic Dependency Treebank‏ الذي أتاحه معهد اللغويات التطبيقية والصورية 
بجامعة كارلوفا ببراغ عام 5١٠7م"‏ وبنك براغ الاعتمادي للغة التشيكية Prague‏ 
dependency Treebank‏ الذي آعلن عنه عام ۲۰۰م. ۳ وبنك كولومبيا الشجري 
للغة العربية The Columbia Arabic Treebank (CATIB)‏ بدعم من وزارة الدفاع 
الأمريكية الذي أعلن عنه عام ۹٠٠۲م»‏ والبنك الاعتادي o‏ القرآني Quranic‏ 


(1) Linguistic Data Consortium. (1992). https://www.ldc.upenn.edu/ 

(2) Taylor, A.& Marcus, M. et al., (1996). The Penn Treebank: An Overview. In A. Abeille 
(Ed.), Treebanks: Building and using parsed corpora (chap. 1). ۰ 

(3) Han, ch. & Eon-Suk Ko, Na-Rae. (2002 ).Penn Korean Treebank: Development and 
Evaluation. In Preceeding ACL Anthology. WD. 

(4) xue, N. & Xia, F. et al., (2003). The Penn Chinese Treebank: Phrase Structure Annotation 
of a Large Corpus. Journal Natural Language Engineering. 

(5) Maamouri, M. & Bies, A.& Buckwalter, T. et al., (2004). The Penn Arabic Treebank: 
Building a Large-Scale Annotated Arabic Corpus. In NEMLAR Conference on Arabic 
Language Resources and Tools. 

(6) Hajic, J. & Smrz, O. et al., (2004). Prague Arabic Dependency Treebank (PADT): https:// 
catalog.ldc.upenn.edu/LDC2004T23 

(7) Cmerjrek, M. & Curin, J. & Havelka, J. (2006). Prague Czech-English Dependency 
Treebank. In Preceeding ACL Anthology. 
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Arabic Dependency Treebank (QADT)‏ برعاية جامعة ليدز الذي أصدر عام 
ta‏ 0 
۹( 


Y‏ . عنونة الدونات اللغوية 

تعنی عنونة الدونة اللغوية Corpus Annotation e‏ باضافة توصیفات - لغوية أو 
غير لغوية - إلى مادَّة المدونة اللغوية سواء أكانت في صورة مکتوبة أو منطوقة أو منطوقة 
في صورة مرئية؛ بغية أن تکون آداة للد للبحث والتطوبر في ميادين معالجة اللغة الطبيعية "۳ 
CIR EF‏ ره اه پا حاق js‏ وحدة لغوية برمز 
أو عدة رموز تشير إليها في النص» بحيث یصبح الوصف U jo‏ للوحدات اللغوية 
ومع ذلك يمكن إضافة هذا الوصف پشکل مستقل عن المادة الأصلية باستخدام آدوات 
a‏ القادرة على الدمج بين التّرميز والنّصّ LAYI‏ وكذلك الفصل بينهما. (a)‏ 

نلحظ أن هناك 5 توارةا لافتا بين مصطلح «العنونة اللغوية» لدى cj AU‏ المحدثين» 
وما كان بماهيه الواصف من Le‏ والتّأويل للنصوص Rb AUI‏ عن طريق ال والعين 
والقلم عبر العقود الفائتة.” فالوصف هو المنطلق الذي يستشقُه الواصف في اللَة - 
من خلال Leid‏ الكامتة في العقل الانسانی- باللغة - آي لغة وصف اللغة Meta‏ 
Language‏ -» «وذلك برد اللا تحدود اللغوي من تجلياته إلى عدد محدود من القولات 
اللغوية فعلى سبیل المثال» يتم تصنیف الفردات إلى آقسام الکلم (اسم فعل» صفت 
حرف ویتم تنمیط الجمل بآنواع تراکیبها وأساليبها (جملة بسيطة وجلة مركبة» جملة 


(۱) تختلف هذه الشروعات فيا بینها في شیئین آساسیین يخضعان للهدف النشود من البنای هما: العلومات اللغوية التي 
تقدمهاء وطريقة تمثيلها على نحو یتناسب مع طبيعة الغرض البحثي للمشروع. 
(Y)‏ هناك مقابل عربي آخر لمصطلح Annotation?‏ وهو " التحشیة"؛ إلا أنني آثرت استخدام المقابل ”العنونة“ لتداوله 
بين الباحثين في هذا المجال بحسب اطلاعي. 
R. & Leech, G. & McEnery, T. (2013). Ibid. ۰‏ ,091510 )3( 
CE)‏ آما على مستوی المدوّنات النطوقة. فتتمٌ العنونة بموجب تقسیم الصوت الکلامي إلى وحدات صوتیق ومن ثم 
تمكينها من ٍضافة العلومات حول الظاهرة الصوتية مثل التفخیم أو النبر أو الوقف. 
McEnery, T. & Hardie, A. (2012). Corpus Linguistics “Method, Theory and Practice".‏ )5( 
First Edition. Edinburgh U.P. P.13.‏ 
McEnery, T. & Hardie, A. (2012). Ibid. P.13.‏ )6( 
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خبرية» جملة إنشائية»...)» ويتم تمثيل العلاقات النحوية باستخدام مجموعة من الرموز 
والدوال النحوية (علاقة الإسناد. علاقة المفعولية» علاقة الوصف. علاقة الاضافت 
علاقة OAC AJL‏ وكذلك يتم تعيين العاني الدلالية بوسمها برموز اصطلاحية تدل 
بشكلها على معناها. ويوضح الشكل رقم Y‏ توصیفا بأقسام الكلام Part Of Speech‏ 
لمفردات ila‏ «یسخن الماء في إناء كبير» باستخدام رموز التوصيف "Tags‏ المعبرة عن 
فئات الکلات. 


الکلمات 


الشکل:۱ شکل تثيلي لتوصیفات الا قسام الكلامية 


وتجدر الاشارة إلى أن علماء العربية قد رسموا معطیات النظام الكلي للغة مذ شرعوا 
في وضع قواعدها في القرن الأول امجري, إذ تحروا في عملهم أن یردوا الظواهر 
اللغوية إلى التشخیص والتجرید» لتوصیف العموم اللغوي في آصول كلية (ناظمة) 
لمن ينشد أن یتعلم العربية»”" والناظر في الکتب النحوية واللغوية بداية من کتاب 


)١(‏ على (نبیل): اللغة واحاسوب. تعريب» ce Y AAA‏ ص۰۳۳ 

(Y)‏ هي رموز توصيفية يتم إدراجها بجوار الکلیات في النص عن طریق المعالجة اليدوية أو الالية بخرض الوصف 
(۳) ینظر: الوسی (ناد): العربية نحو توصیف جدید في ضوء اللسانیات الحاسوبية» المؤسسة العربية للدراسات والنشر» 
الأردن» ۰ ص 1٩-1۱‏ . 
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سيبوية إلى الآن a‏ أن محورها الأول ت* تشخیص اللغة وتحليلها بلغة الوصف . ونتلمس 
POSU edd‏ جني اكلام كله IE‏ آضرب اسم وفعل وحرف جاء 
لعنی»۱» ]3 یشخص القولات اللغويةء لعلّه هدي إلى النظر في مکونات الجملة ثم 
استنباط العلاقات بینها. 

ويقتضي التوصيف منهجًا یستند إلى مبادی نظرية تسوّغ التحلیل والتأويل بالاعتماد 
على الشمول والاختصار في اختيار مجموعة من العطیات اللغوية Tags set‏ تمثل تلکم 
المعلومات المنشودة» وعدم التناقض في التحلیل بالتعرّف على النظائر في ضوء المعطيات 
(القولات) اللغوية.9) 


۱-۳ لاذا عنونة الدونات اللغوية؟ 

d‏ مضیار السعي لوضع حلولٍ لامكال اه الله ار أيقن الكثيرون 
أن حل إشكالية اللغة بصورة Ble‏ رهن با يمكن إنجازه على صعيد إشكالية gli‏ 
PENES‏ زار نیت مهو وتارس اند كين TURN‏ 
Je‏ أغوار المخ "e MU‏ وينحي الذ کاء الا صطناعي إلى محاكاة هذه العرفة لدی 
الإنسان» وسَبّر آغوارها باتباع أساليب منهجية قادرة على التعامل مع هذه العرفة 
db‏ اكتسابهاء ساعيًا إلى تمثيلها في ina‏ مخططاتٍ من الفاهیم التي تتداخل مع 
بعضها البعض لتجسيد البنية RAD‏ من الناحية c ll‏ وذلك من قبيل استضافة 
ix‏ من فيل العلوم df, Pall‏ التي اشتملت عل النطق والریاضیات والاحصاء 
ونظريّة الاحتمالات» وفي (طار ee‏ الاستدلال والاستباط اللذين يقومان عليه 
خوارزمیات الذكاء الاصطناعي کات لت Cas ES et‏ 
ومتطلبً حيويًا Supervised learning odil U‏ € لما پستمد منها العطیات التي 


(۱) ابن جني (أبو الفتح عثمان): اللمع في العربية» تحقيق الدكتور سميح أبو مغلي» دار مجدلاوي للنشر عمان» ۱۹۸۸م» ص ٠١‏ . 
Kennedy, G. (1998). An Introduction to Corpus Linguistics. Longman. P.220.‏ )2( 
(۳) علي (نبیل)» حجازي (نادیة): الفجوة الرقمية» ص Y ١7‏ 
)€( التعلم الموجه Supervised learning‏ هو أحد الوسائل آو الطرق الستخدمة في التعلم Machine Learning JM‏ 
يستمدٌ معطياته من البيانات الوصفة لتكون خر جاته Outputs‏ نابعة من التوصيف المدخل cInput‏ ينظر: 
Murphy, Kevin P. (2012). Machine Learning A Probabilistic Perspective. The MIT Press.‏ 
London, England. P.2..‏ 
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تبی عن الاستدلال والاستتاج o cet a‏ 

i Ji ADI تستم معطياتها من الدونات‎ UYI التعلم‎ e عدید من‎ iiy 
من خلال تدريبها على تلك نات‎ ad إحصائية‎ ce لبناء‎ Tagged Corpora 
التطبيقات‎ ce i UL AKT التي تعد بوصفها حجر الاساس في منظومة‎ 
لتفسير الظواهر ال‎ Ua الحاشوبيّة المختلفة الا فضلاً عن كونها‎ 
والحاسوييُون‎ TE لح لذا تبناها‎ s plos deu 
D lach موضوعا فتنظيرًاء‎ 

ولا انطلقت الدونات اش ENS‏ نی صورة مشروعات Ale‏ وار 
ترعاها ا لجامعات» وتدعمها oU gl‏ والوزارات الحكومية”"» فقد تر شخت ملامح 
أركانها المنهجيّة» ثم تنامی الاعتناء بها في ضوء النطلقات لدفع جهود التطویر والبحث 
في معالجة اللغة الطبيعية؛ لتشمل آنظمة اللغة بمستویاتها اللغوية الختلفة» وذلك في 
(طار تطبیقها للنظریات اللغوية التي تعنی بالواقع اللغوي وجتمعه. 


Das 


۲-۳ العاییر الأساسية لعنونة الدونات اللغوية 

ينبغي أن یکون قبولنا للعنونة الفيدة والغنية بالعلومات مرهوتّا إلى حد كبير بتقییمها 
من حیث توخیها الطرق النهجية التي تبرز جدوی الوصف. ومدی التزامها بالضوابط 
النظرية والمنهجية» إذ الضوابط دافعة إلى التقيد بالنتائج الرجوة من الوصف") 
وبالنظر في إرهاصات الشروح العلمية لعنونات المدوّنات اللغوية» سنجد العدید من 
الشروحات من الصعب تطبیقها لأنها غير مشروطة با منهجية؛ لذا التزم علماء الدوّنات 
اللغوية بعددٍ من العایبر الأساسية عند شروعهم في عنونة الدونات آوجزها في بلي: 

۱-استخدام طرق العنونة المبسّطة — من ملازمة الوصف للوحدات اللغوية عبر 
علامة Slash‏ (/ ) أو «Underscore C)‏ مثل: کتب/ فعل ماضء کتب -فعل ماض- 


(1) Pustejovsky, J. & Stubbs, A. (2012). Ibid. ۴21۰ and Lüdeling, A. & Kytö, M. (2008). 
Ibid.P. 89. 


(2) Indurkhya, N. & Damerau, F. (2010). Handbook of Natural Language Processing. Second 
Edition.CRC Press.Taylor & Francis Group. London.P.167. 


(۳) السعید (العتز بالله): مدونة معجم تاريخي للغة العربية» أطروحة دکتوراق جامعة القاهرة 0۲۰۱۱ ص٤‏ . 
Garsid, R and Leech, G and McEnery, T. (2013). Ibid. P.6.‏ )4( 
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بحيث یمکن الفصل بين الترمیز والنص مع إمكانية استرداد الصورة الأولية (الادة 
الخام)؛ للافادة منها في البحث. والنمذجة اللغوية Language model‏ .° 

۲-تقتضي الطرق المنهجية لعنونة المدوّنة اللغوية التبضّر في عرض معطيّات النظام 
اللغوي الذي رسمه علماء اللغة على اختلاف مناهجهم وآرائهم. 

۳-ينبغي أن Cass‏ آولا العلومات الأساسية التي سیقدمها التطبیق النشود» ثم 
نتخیر العلومات (قائمة السمات اللغویة) التي سنستقیها من الدونة اللغوية؛ وذلك 
للوقوف على منهجية مناسبة للعنونة. 

4 -ينبغي أن حرص صناع الدوّنات عل التمییز بين الأشباه والنظائر؛ حتی یتسق 
العمل اتساقا شدید الاحکام» وفي هذا ضرب من الانسجام بين الفاهیم اللغوية 
cue lae y‏ حيث یظهر آثره - فیما بعد - في التطبیقات النشودة. 

۵-قد یستوجب التوصیف الاقتصار على التحلیل والتصنیف والوصف. فلا 
یعتبر - مثلا - التأویل والحذف والاضار في الوصف النحوي؛ لأن التوصیف مرتبط 
بالحدف المنشود." 

7 -تخضع النهجية - أي منهجية العنونة - لضوابط ومعاییر تحددها طبيعة اللغة 
والهدف النشود من العنونة» ومن ثم لا تکون هناك منهجية ثابتة باعتبارها معيارًا مطلقا 
لعنونة الدونات اللغوية» فالنهجیات تيل إلى التفاوت فيا بينهاء فعلى سبیل الثال» 
تختلف منهجية عنونة آقسام الکلام POS Tagging‏ التي غرضها أن تکون مدخلا 
ابتدائيا للتحلیل النحوي عن التي ها غرض آخر مثل استرجاع العلومات أو التحلیل 
الدلالي أو غير ذلك. 

۷- ترمّز الدونة الموصفة MES‏ بلغة «Markup Language E‏ تقوم على 
توصیف بیانات النصوص - من خلال مجموعة من العناصر والوسوم يتم نظمها 
وفق القواعد الكتابية للغة - بحيث یکون لديا قابلية الاستخدام للأنظمة احاسوبية 


(1) Garsid, R. & Leech, 0. & McEnery, T. (2013). Ibid. P.2. 

۰۲ Ale الاداب بمنوبة - تونس»‎ RIS عاشور(التصف: بنية الجملة العربية بين التحلیل والنظرية» منشورات‎ (Y) 
. ص11‎ qM 

(3) 091510, R. & Leech, G. & McEnery, T. (2013). Ibid. ۰ 


—YA- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


وخاصة المتصلة بالشبكة العنكبوتية. وتعتبر لغة الترميز القابلة Extensible sli W‏ 
Markup Language (XML)‏ بمثابة اللغة التوصيفية المثالية» إذ تدعم نظام الحرف 
الدولي الوخد للعديد من اللغات الطبيعية. ^ 

وجملة القول أن الالتزام بالضوابط النظرية والمنهجية في عنونة المدونات اللغوية 
أمر شاق يزيد من صعوبته طبيعة العمل اليدوي في عنونة الدونات التي تتطلب وقتا 
وود کرو doutes dal desi‏ تطريرها adii‏ افو d‏ 
الدونات اللغوية على وضع الرموز Tags‏ من خلال مجموعة من الفاتیح - داخل 
البرنامج- تمثل تلك الرموزء كما تتعرّف -أيضًا- على الفردات المتشايهة التي يحتمل أن 
يكون ها رمز واحد» مع إتاحة ترميزها مرة واحدق وغير ذلك من الهام التي تقلل من 
الوقت والجهد المبذولين. 

وتجدر الإشارة إلى إمكانية الإفادة من تقنيات معالحة اللغة الطبيعية - لا سيا النجزة 
بالفعل - في عنونة المدونات اللغوية إذ يمكن استخدامها في تحليل مادة المدونة اللغوية» 
ثم فحص الخرج يدويًا؛ لتقليل نسبة الأخطاء الناتجة عن الآلية. وجدير بالذكر أن 
استخدام الأدوات والتقنيات المساعدة في العنونة تساعد على تقليل الأخطاء المحتملة 
الناتجة عن العنونة اليدوية الخالصة. 


CU)‏ لغة الترميز القابلة للامتداد XML‏ عبارة عن مجموعة من القواعد لوصف البيانات وتنظيمهاء بحيث يستطيع 

الحاسوب قراءتهاء ومن ثم سهولة تنقلها عبر الويب والتطبيقات البرمجية» كا آنها تدعم اليونيكود Unicode‏ الدولي 

لختلف اللغات الطبيعية» إذن فهى طريقة لوصف البيانات. ينظر: 

Birbeck, M. et al., (2001). Professional XML 2nd Edition. Published by Wrox Press Ltd, 
the United States. P.5-8. 
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مقدمة: 


يقتضى البناء الشجري النحوي أو العنونة النحوية الاستناد إلى مدونة لغوية» تكون 
بمثابة النواة الأولى للبناء المنشود؛ لذا تناولت في هذا الفصل - بداية - مفهوم المدونة 
اللغوية» واستخداماتهاء وإرهاصاتهاء ثم شرعت في اختيار مادة الدونة اللغوية وفق 
المعايير التي يتم بها اختيار النصوصء بحيث تعكس الواقع اللغوي؛ sga‏ نصوصها با 
يتناسب مع الأنظمة الآلية» ثم أجريت على هذه النصوص نفسها عملية تجزئة النصوص 
التي يتم بمقتضاها تقسيم النص إلى جمل ثم إلى وحداتِ بحيث تكون مؤهلة للعنونة 
النحوية في بعد. وقد سار هذا الفصل في مبحثين على النحو التالي: 

Corpus Material à, NU EATER ENS TOR CE 

- الدونة اللغوية» واستخدامها» وجالات الافادة منها. 

- إرهاصات الافادة من الدونات AC‏ في الدراسات النحوية. 

- تحدید مادة الدونة اللغوية عينة الدراسة. 

- التحلیل الاحصائی لادَّة الدونة اللغوية. 

ZI ig -‏ للمدونة اللخوية - عينة الدراسة - قبل dg el‏ 


ANS 
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۲- البحث الثاني: تجزئة او Tokenization‏ 

- مفهوم تجزئة التصوص. ل 

- مستویات تجز 3 نصوص الدونة اللخوية عينة الدراسة. 

- التو حيد اهحجائی Orthographic Normalization‏ 

- نیاذج لتجزئة الوحدات اللغوية في المدونة اللغوية عينة الدراسة. 
- التحلیل الا حصائي لوحدات Tokens‏ المدونة اللغوية. 


- ۲۲ 
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.١‏ المدوّنة اللغوية» واستخدامهاء ومجالات الإفادة منها 


«تعنى المدونة اللغوية بالبحث في الظواهر اللغوية من خلال مجموعة غير منتظمة من 
النصوص المكتوبة أو النطوقة».(۲ ومع تطور لسانيات المدونة Corpus linguistics‏ 
> التي أصبحت قسي) لعلم اللغة الحاسوبي Computational linguistics‏ - أمكن 
التعامل مع هذه النصوص آلياء والتحكم في بياناتها بالإضافة أو الحذف أوالتعديل» 
فضلاعن آنا أصبحت حجر الزاوية في بناء النماذج الحاسوبية للغة. © 

قد اخذت المدوّنات اللّغوية عدة مراحل متعاقبة لاستخدامهاء «ففي عام ۱۹۵۰م 
إلى 197١م‏ كان الاستخدام الشائع للمدونة اللغوية هو إمكانية إخضاعها للتحليل 
الإحصائي - باستخدام المفهرسات الآلية Concordances‏ - من جوانب عديدة» 
منها التعرّف على شيوع الكلمات وسياقات استعیاها في المدونة العنية بالدراسة؛ وهو 


(1) Kennedy, G. (1998). Ibid P.1. & McEnery, T. & Wilson, A. (2001). Corpus Linguistics 
“An Introduction". Second Edition. Edinburgh University press.P.29 . 


نقلا عن: السعيد (المعتز بالله): مدونة معجم تاريخي للغة العربية » ص٥‏ . 


as 
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مفيد بالطبع لدراسة الظواهر اللغوية على الستویین النحوي والدلالي».“ وکذلك في 
احتیاجات التعلم. 

وما لبث الأمر أن وصل إلى توجیه الانظمة الحاسوبية الخبيرة إلى فهم اللغات 
الطبيعية وقدرتها على تمثيل اللغة بمستویاتها كافة من خلال إخضاع الآلة لتطلبات 
البحث اللغخوي» «وهو ما يشار إليه عادة بتفاعل الانسان مع الالة» ۳ إذ بدأ الباحثون 
عام ۱۹۸۰ بتطویع الخوارزميات الرياضية O‏ للمعالجة اللغوية من خلال تدريبها 
وتطویرها على الظاهرة اللغوية؛ لتسمحَ للحواسیب بامتلاك خاصية التعلم. 

وكان نتاج هذه الفترة تطبيقات التعدّف JY‏ على الکلام Speech Recognition‏ 


ببناء ناذج لغوية محددة قادرة على التعرّف على الكلمات/ الصوت - باستخدام 
المتتابعات اللفظية N-gram‏ © وأدوات ماركوف الخفية HMMs‏ 2- من خلال 


عينات من اللغة المحكيّة» ثم تطور الأمر في نهاية المتتصف الثاني من القرن العشرين إلى 
TN‏ ام TER‏ التعلم الآلى Machine Learning‏ ?( في ce elo‏ إحصائية للترحمة 


(1) Pustejovsky, J. & Stubbs, A. (2012). Natural Language Annotation For Machine Learning. 
Frist Edition.O' Reilly Media. P.10. 
.۲۷ بونيه (الان): الذكاء الاصطناعي واقعه ومستقبله» ترجمة د.علي صبري فرغلی» عالم المعرفة» ۰۱۹۹۳ ص‎ (Y) 
هی مجموعة من الخطوات التسلسلة - الرياضية والنطقية - لحل مشكلة ماء‎ (Algorithm) خوارزمية الرياضية‎ | )۳( 
ص ا‎ SY nl » دعبول (موفق)؛ وآخرون: معجم مصطلحات المعلوماتية» الجمعية العلمية السورية المعلوماتية» دمشق‎ 
عملية من التتابعات الاحصائية لوحدات النص أو الجملة في ضوء خوارزمیات‎ :(N-gram) التتابعات اللفظية‎ C£) 
Language أو عدد التتابعات على ما تصبو إليه التطبیقات النشودة» وتسمی أيضا بنمذجة اللغة‎ N رياضية» وتتوقف‎ 
ينظر:‎ .- 061 
Jurafsky,D. & Martin, J. (2007). Speech and Language Processing: An introduction to 
natural language processing. Second Edition.P.93. 
هي خوارزمية رياضية تصادفية» تستخدم للتعرف على‎ :(Hidden Markov Models) مارکوف الخفية‎ ce (o) 
آندري مارکوف 1۷۲۵70۷ ۸۵۲66 في بداية القرن‎ JUU الخواص الا حصائية لتسلسلات غير ملحوظة. وتعود‎ 
العشرین. ینظر:‎ 
Ghahramani, Z. (2001). An Introduction to Hidden Markov Models and Bayesian Net- 
works. International Journal of Pattern Recognition and Artificial Intelligence.P.2. 
هو امتلاك الالیات الحاسوبية القدرة على التعلم من خلال البیانات»‎ :(Machine Learning) JM التعلم‎ CO 
Pattern وذلك بتصمیم الخواززميات الرياضية لاستقراء واستنتاج القوانین العامة أو ما تسمی بالتعرف على الأنماط‎ 
من خلال خواص تلکم البیانات. ينظر:‎ 0 
Ethem, A. (2010). Introduction to Machine Learning.The MIT Press Cambridge, Massa- 
chusttes, London,England. Second Edition. P.2. 
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الآلية معتمدة على جملة المعطيات التى تمثلها تلك النصوص اللغوية العنية بالتحليل.“ 

وتعددت مجالات الافادة من الدونات اللغوية - في دراسة علم اللغة من جانب 
واللغویات الحاسوبية من جانب آخر- فمنها دراسة اللهجات وتعلیم اللغات؛ 
وصناعة العجات. والدراسات النحوية» والتحلیل الدلالي والاحصاء اللغوي... 
وغیرها من متطلبات البحث اللغوي. ۲ 


Y‏ إرهاصات الافادة من الدونات اللغوية نی الدراسات النحوية 

d‏ تكن فكرة استخدام الدونات اللغوية في دراسة جوانب اللغة ces‏ الدراسات 
النحوية وليدة اللحظة بانصهار الحاسوب في الجتمعات الإنسانية» بل كانت الفكرة ° 
متأصلة في العدید من الدراسات الجادة مذ ما يقرب من بضعة عقود؛ إلا أن حدوث 
الطفرة المعلوماتية» وتعزیز العلاقة بين اللغة واحاسوب في العصر الحديث شحذ رؤيتها 
النظرية» وأرسى مناهجها» وثبت أركانهاء وملامحها العلمية. 


۱-۳ مرحلة ما قبل ظهور الحاسوب 

وتدور co ale‏ هذه الرحلة حول وصف الظاهرة اللغوية» واستنباط القواعد 
التي تحکمها من خلال KË‏ عدد ضئيل جدًا من الناذج النصية أو الصوتية؛ لصعوبة 
التحلیل - آنذاك - الذي یتطلب وقتا وجهدًا کثبرین» ومع ذلك ینقصه الدقة» ويغلبه 
الأخطاء النهجية. ومن آبرز هذه الحاولات: 


۱-۱-۲ محاولة تمثيل قواعد اللغة الانحليزية 


بدا يسبرسن Jespersen‏ في مطلع النصف الأول من القرن التاسع عشر البحث 
في جمع مدونة لغوية» مصدرها الصحف والمجلات الإنجليزية؛ لاستخدامها حينذاك 


(1) Pustejovsky, ل‎ & Stubbes, A. (2012). Ibid.P.13. 
.۵ السعید (العتز بالله): مدونة معجم تاريخي للغة العربية « معالجة لغوية حاسوبية)؛ ص‎ (Y) 
يجب الاشارة هنا إلى أن أصل الفكرة والانتفاع بها یعود إلى ما فعلوه النحاة العرب من جمعهم لکلام آهل البادية‎ )۳( 
وأشعارهم» متبعين في ذلك شروطا وضوابط منهجية مبثوثة في كتبهم» وباستقرائها وضعوا قواعد النحو العريي.‎ 


== 
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- للمرة الأولى- في الدرس النحوي» فکانت الدونة معطی مباشرًا لتمثیل قواعد اللغة 
الانجليزية ى) وردت في کتابه « قواعد النحو الانجليزي الحديث وفق البادی التارمخیة» 
«A Modern English Grammar on Historical Principles‏ ثم تطور الأمر من 
خلال بعض الدراسات التي تقوم على الوصف النحوي إلى بیان الاحکام النحوي؛ 
والتناسق بين العلاقات التركيبية في الدونة اللغوية الحددة زمنیا وآنيا. وکان من آهم 
هذه الدراسات کتاب کروسینجا Kruisinga‏ (۰)۱۹۳۱-۱۹۳۲ وکتاب بوستا 
Poustma‏ ۲۲۱-۱۹۲۹ ۱۰)۱۹) 

ثم نشر فریز Fries‏ کتابه «القواعد النحوية للانجليزية الأمریکیة) American‏ 
English Grammar‏ عام ۰ ۱۹6م الذي تضمن أمثلة من الخنطابات الرسمية لأعضاء 
الکونجرس الأمريكي؛ لیعکس واقع الاستخدام اللغوي لقواعد اللغة الانجليزية. O‏ 

وني عام 954١م‏ تطورت هذه الرحلة إلى مرحلة آکثر نضجاء حيث قام راندولف 
كويرك Randolph Quirk‏ ببناء مدونة جامعة -آنذاك- لاستعالات اللغة الانجليزية 
The Survey Of English Usage (SUE)‏ © 


۲-۱-۲ محاولة تحلیل الجملة العربية 

وفك قات eu eed]‏ اما سا در ان العف خاقور نى 
کتابه«بنية الجملة العربية بين التحلیل والنظریة» عام ۰۱۹۷۷ حیث استقصی العلاقات 
التركيبية في نظام الجملة استنادًا إلى مدونة من اللغة العربية» تتضمن ثلاثة نصوص 
(حدّث آبو هريرة قال لمحمود المسعدي» والمنعرج لمصطفى الفارسي» وخرافات عز 
الدين «(Gall‏ «وكان ذلك البحث اختبارًا لنظام اللغة العربية وتخصيصًا لقوانينها 
النحوية ومعانیها الفیدة»٩)‏ 


Kennedy, G. (1998). Ibid. ۰‏ )1( 
نقلا عن: السعيد (العتز بالله): مدونة معجم عربي معاصر « معالجحة لغوية حاسوبية)» أطروحة ماجستیر جامعة القاهرق 
ee ۹۹۸‏ ص pya‏ 

(2) Kennedy, G. (1998). Ibid. P.17. 
M نقلا عن: السعید (العتز بالله): مدونة معجم عربي معاصر « معالجة لغوية حاسوبية)» ص‎ 
. السابق» ص۱۱‎ )۳( 
۲۹۱۰ عاشور(المنصف): بنية الجملة العربية بين التحلیل والنظری ص‎ C£) 


es 
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وتناول جلال شمس الدين في كتابه «الأناط الشكلية لكلام العرب» عام 996١م‏ 
فكرة الأناط اللغوية معتمدًا على نصوص أكثر قربا للاستعمال آنذاك» وتحرّى في عرضه 
للظاهرة اللغوية على الوصف MI‏ فقط . 


۲-۲ مرحلة ما بعد الحاسوب 


الإعصار المعلوماتي الجارف الذي كان É‏ لأساليب التعلّم الاحصائي؛ إذ تبلورت 
مناهجهاء وتطورت أدواتهاء واكتملت أركانها. 

«ففي مطلع السبعينات من القرن المنصرم» وتحديدًا عام e AVe‏ ظهرت فكرة 
البنوك الشجرية النحوية OU]‏ اکتمال أركانها المنهجية» حيث قام أولف تلان Teleman‏ 
UIF‏ وزملاژه بجامعة لند dah LUND‏ محاولة جادة لبناء مدونة معنونة بالعلاقات 
النحوية للغة السويدية» واحتوت هذه الدونة على 300,000 آلف كلمة ما بين مکتوبة 
ومنطوقة» وهذا بعد انجاژا (Le‏ -آنذاك- حیث اعتمدوا ق صناعتها ejl de‏ 
اليدوي لکلا الستویین التمثيلي والوظيفي».۷) 

«واقتصر الأمر- حینذاك - على اللغة السويدية دون غيرهاء حتی اتضحت معال 
النهج. وتطوّرت آدواته التحليلية - وذلك في منتصف التسعینات من القرن الاضي - 
حیث نت الوسسات العلمية والتجارية الشروعات اللغوية الکبری» وتنامی الاعتناء 
بالبنوك الشجرية النحوية على نطاق واسع في عدة لغات مع التبضر في تقتضیه المعالحة 
MATTIS‏ 

وقد تولت موسسة شبكة البیانات اللغوية بینسلفانیا Linguistic Data‏ 
Consortium (LDC)‏ — خلال العقدین الاضین- مشر وعات مائلة للغات متعددق 
كان آبرزها بنك براغ الاعتمادي للغة الانجليزية والعربية والتشيكوسلوفاكية» وبنك 


(1) Lüdeling, A. & Kytó, M. (2008). Corpus Linguistics An International Handbook. Walter 
de Gruyter.Berlin, Germany.P.226. 


(2) Pustejovsky, J. & Stubbs, A. (2012). Ibid. P.226. 
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بنسلفانیا النحوي للغة العربية والصينية» وقد تعددت مادَّة هذه الشروعات بين 
التصوص المكتوبة والنطوقة. () 
۳. تحديد مادة الدونة اللغوية عينة الدراسة 


لا كان الحدف من هذه الدراسة تمثيل العلاقات التركيبية في العربية العاصرة 
الکتوبة" لاسیا في الصحافة الالكترونية ex, all‏ لكوغها الأكثر انتشاژا Cel y‏ 
وتتوافق إلى حد کبیر من حیث البنية التركيبية مع ما تستهدفه تطبیقات معاة اللغات 
الطبيعية» فقد روعي عند اختيار نصوص المدونة - عينة الدراسة - عدة معايير: 

۱-۳ انتماء النصوص للصحافة الإلكترونية : 

"العربية العاصرة لغة مكتوبة تستخدم في جالات الكتابة» فهي لغة الدب بمختلف 
ألوانه ولغة العلم بمختلف فروعه» ولغة الصحافة نمط من هذه POM‏ بل - هي 
إن أردنا الدقة - تمثل كل الافاط السابقة» إذ تفرد الصحيفة مساحات من صفحاتها 
للأبواب الثابتة“. ?€ 

ولغة الصحافة ليست لغة فنية خاصة يمتاز بها مجموعة من الناس» بل هي لغة عامة 
يتفق من يستطيعون القراءة على فهمهاء وما تقدمه لقرائها يجد طريقه ميسّرًا إلى لغتهم 
حين يكتبون أو حين یتکلمون» فليس غريبًا إذن أن تكون لغة الصحافة أقرب DEII‏ 
السابقة AE‏ للخصائص اللغوية التي تميز العربية الآن. O‏ 

ومع التطوّر الحائل الذي لحق وسائل الاتصال وتكنولوجيا العلومات تزايدت أهمية 


(1) Linguistic Data Consortium. (1992). https://www.ldc.upenn.edu/ 


(Y)‏ اللغة النطوقة ذات حركة داثبة لا یمکن متابعتهاء ووضع القواعد التي ترسم خصائصهاء... وعلیه فاللغة الکتوبة 
قد نالت حظا آوفر -في الدراسة- من اللغة النطوقة» «حیث نجد أن الدونات المكتوبة هي الجانب السائد في بناء البنوك 


الشجرية. ویرجع ذلك الأمر لا تمتاز به من ثبات لاستقراء واستنباط ما تُنْحي عليه النظریات النحوية. ینظر: 
Pustejovsky, J & Stubbs, A. (2012). Ibid. P.227.‏ 


Y ۱ ص‎ (us عبد العزيز( محمد حسن):لغة الصحافة العاصرق دار العارف»‎ (v) 
: ١١ص المرجع السابق»‎ CE) 


—YA-— 
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الصحافة الالکترونیة باعتبارها لغة مشتركة بين آغلب فئات المجتمع» فقد أصبحت من 
أهم وسائل الإعلام العاصر وتنشر بين الشرائح المجتمعية كافة بصورة متسارعة» وخاصة 
بعد أن توفرت شبكة الإنترنت في كل مکان» فضلا عن آنها تتفوق بعدة سات كالفورية 
والتفاعلية» ولا يمكن xb‏ حال من الأحوال أن تتوافر للصحيفة الورقية المطبوعة. © 

۱-۱-۳ آنواع الصحف الإلكترونية: 

۱-۱-۱-۳ الصحف الإلكترونية الكاملة: هي صحف قائمة بذاتهاء يتم نشرها 
وإصدارها ٍلکترونیا cas‏ وقد أثبتت هذه الصحف الإلكترونية الكاملة حضورها على 
الستوی العالي في مجالات رصد الأحداث» وصناعة الخبر» وتتبع الحدث ونشره في 
وقت حدوثه وبذلك سبقت الصحف الورقية بنصف يوم على الأقل. 

۲-۱-۱-۳ النسخ الإلكترونية من الصحف الورقية: وهي نسخ إلكترونية من 
الصحف التي تصدر بصورة ورقية. وتهدف النسخ الإلكترونية إلى استطلاع الرأي 
والتفاعل مع القرّاء. 

وقد معت نصوص المدونة — عينة الدراسة - وفقا للصحف الإلكترونية الكاملة؛ 
لتعكس الواقع اللغوي في الوقت الراهن من حيث استخدام الأناط التركيبية المختلفة. 

وقد استقی البحث مادة المدونة”" من موقع اسلام آون Islam On Line ¿pY‏ © 


(۱) هناك محاولات عديدة لوضع تعريف واضح للصحافة الإلكترونية» ولعل آهمها تعریف الدکتور نواف حازم» 
حيث عرفها بأنها «هي الصحافة التي تتم عبر طرق إلكترونية» وتعتمد في تکوینها ونشرها على عناصر إلكترونية تستبدل 
الأدوات التقليدية بتقنیات إلكترونية اتصالية حديثة کالانترنت» وتستبدل مخرجاتها الورقية بأخرى رقمية.» ینظر: 

مجلة الشريعة والقانون؛ العدد السادس والأربعين» ۰2۲۰۱۱ ص ۰۲۱۳ 

(۲) الرجع السابق» ص ۰۲۱۳ 

(۳) تمتلك الشركة اهندسية لتطویر النظم الرقمية RDI‏ هذه النصوص بعد شرائها من موقع اسلام آون لاين» وقد أخحذث 
هذه التصوص باذن منها بغرض البحث. 

(E)‏ قد تم إنشاء موقع آون إسلام On Islam‏ باعتباره بدیلا عن ٍسلام آون لاين» ویعمل عليه فریق موقع إسلام آون 


e ac 
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ی الفترةمن ۲۰۰ ل ل 
ووقع هذا الاختیار على إسلام آون لاين لعدة آسباب: 


e‏ التزامها بالكتابة العربية الفصحى غير الختلطة إلا نادرًا. 

ه معظم الحررین العاملین بها من اللغویین؛ وهذا یعکس نقاء الفردات والأساليب 
اللغوية على الکتابة. 

ه كثرة زوّار الوقع يوميًا مقارنة بالصحف التناظرة. 

ه جدیّة الوضوعات والتقائق العلمية الى تتناوضا. 

ه التنوع الوضوعي في كافة الجالات الإنسانية. 


۲-۳ المنهجية فى اختيار نصوص المدونة اللغوية 
لا كانت المدونة اللغوية هي جملة المعطيات التي تخضع للهدف النشود من صناعتهاء 
فقد تعددت طرق اختيار النصوص بين طريقتين: O‏ 


۱-۲-۳ الطريقة الأولى: 


آسلو ب الحصر الشامل Comprehensive Inventory‏ 


يستخدم هذا الأسلوب TS]‏ كان الغرض من الدراسة حصر نصوص الجتمع اللغوي 
التي تمائل الواقع اللغوي برمته. وهذه الطريقة أو الأسلوب یستخدم عادة في صناعات 
العاجم التاريخية للغات, أو في الدراسات المسحية ذي الاطار الزمکاني الحدد. 


(۱) هي الفترة التي حظي فیها موقع إسلام آون لاين بترتیب متقدم بين مواقع شبكة الانترنت - من حیث عدد زائریه 
- وفقّا لتصنيف أليكساء وذلك منذ انشاء إدارة الوقع بالقاهرة حتی قبیل GALI‏ الحادث بين الشركة المصرية النتجة 
للموقع»میدیا ٍنترناشونال» وجمعية البلاغ القطري المالكة للموقع الرئيسي عام ۰۲۰۱۰ والتي أدت إلى اغلاق موقع إسلام 
أون لاين» ونقل تحریره إلى قطر. ينظر: 

wikipedia The free Encyclopedia. (2015). 7 

.۳۹-۳ £ السعید (العتز بالله): مدونة معجم تاريخي للغة العربية « معالجة لغوية حاسوبية)» ص‎ (Y) 
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۲-۲-۳ الطريقة الثانية: 

Statistical Sampling Theory نظرية العينات الإحصائية‎ 

وتعتمد هذه الطريقة على اختيار عينة من النصوص التي تصف الواقع اللغوي سواء 
أكانت عينة عشوائية أو غير عشوائية C‏ بحسب ادف المنشود. وتستخدم هذه الطريقة 
في تجسيم خصاتص الواقع اللغوي وسماته من خلال عينة من النصوص. 

ولا كانت نصوص الدونة اللغوية تمثيلا لأناط التركيب الجمل في الاستعمال» 
ومعطيّ مباشرًا لنظام الجملة في اللغة المدروسةء فكانت نظرية العينات الإحصائية 
أكثر ملاءمة لاستنباط واستقراء الخصائص التركيبية في النحو العربي في لغة (الصحافة 
الالکترونیة). وقد حت نصوص الدونة اللغوية في صورة عينة قصدية لا تخضع 
لضوابط أو قيود» بحيث تغطي عدة مجالات متنوعة. 


۳-۳ تنوع مادة المدونة اللغوية عينة الدراسة 

وقد صنّفت مادة المدونة اللغوية- عينة الدراسة - iUe‏ لتوخي أضرب العلاقات 
التركيبية في بنية الجملة المتمثلة في نصوص الدونة: ۱ 

JL e‏ السياسة. 

e‏ حال الاقتصاد. 

Jie e‏ الفنون. 

« جال الاجتاع. 

e‏ جال العلوم. 

ه جال الرياضة. 


(۱) تنقسم العينات الا حصائية العشوائية id]‏ 

Simple Random Sample العينة العشوائية البسيطة‎ 

Stratified Random Sample ب.العينة العشوائية الطبقية‎ 

Systematic Random Sample ج.العينة العشوائية النتظمة‎ 

د.العينة العنقودية أو التعددة المراحل Cluster Sample‏ 

والعینات الإحصائية غير العشوائية إلى: 

Purposive Sample أ.العينات القصدية‎ 

ب. العینات الخصصية Quota Sample‏ 

ينظر: خليل (شرف الدين): الإحصاء الوصفي» شبكة الأبحاث والدراسات الاقتصادية» د.ت» ص ۰۱۳ 
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وتجدر الإشارة إلى أن التنوع في مادة الدونة اللغوية يحقق قدرًا کافیّا من آنیاط الترکیب 
امحملی في الاستعمالء والمفردات والأساليب المختلفة» إذ يختلف النمط الترکیبی من Jle‏ 
| وقد آثرت أن أجعل النصيب الأكبر من النصوص في المجال اااي mco‏ 
الواقع اللغوي الراهن الذي تعددت فيه الكتابات esta ea fs‏ السا وى قدا 
مكنا من العلاقات التركيبية الستعملة التي ثرت في استع اها على الجالات الأخرى. 


4. التحليل الإحصائى لادة الدونة اللغوية 

تمثل المدونة اللغوية Sample ie‏ من جتمع اللغة غير الحدود «Infinite Universe‏ 
تحمل خصائصه وصفاته وتكون مرآة للواقع اللغوي العني؛ لكنها تمثل مجتمعًا لخویا 
محدودًا بذاتها Finite Universe‏ - وهو جتمع الدراسة الذي يضم مدونات فرعية 
Sub-Corpora‏ تعد في حد ذاتها عينات المجتمع اللغوي المحدود. ''' ويوضح الشكل 
رقم ۲ تمثيل المدونة اللغوية داخل المجتمع اللغوي. 


المدونة اللغوية 


المجتمع اللغوي 


الشکل:۲ الجتمع اللغوي- المدونة اللغوية (عينة الدراسة). 
ولعل التحليل الإحصائي من آهم ما يتصف به العلم - من حيث الانضباط - في 
التعرّف على الظاهرة اللغوية وخصائصهاء ومدى الانتظام الإحصائي للغة من حيث 
توزيع المغردات داخل النصوص. والصيغ الصرفية والنحوية» وغيرها. 


LOE السعيد (العتز بالله): مدونة معجم تاريخي للغة العربية «معالجة لغوية حاسوبية)» ص‎ )١( 
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ويدف التحليل الإحصائى لادة المدونة اللغوية إلى وصف بياناتها اللغوية؛ لمعرفة 
مدى استقرار مصدر البيانات اللغوية من حيث الانتظام الإحصائي لتوزيع المفردات 
داخل النصوصء وذلك لوجود علاقة إحصائية ثابتة - بين حجم النص اللغوي» وعدد 
الفردات غير المتكررة فيه - تنم عن انسجام النص اللغوي» وهي العلاقة الإحصائية 
المعروفة بقانون زیبف law‏ ۲۱71085 

ویعرض الجدول رقم ۱ بیانات أو إحصاءات الادة اللغوية عينة الدراسة وفق 
التصنیف المجالي: 

بیانات الدونة اللغة -عينة الدراسة- وفق التصنیف المجالي 


الحدول:٠‏ مجالات الدونة اللغویة-عينة الدراسة- وعدد کل‌اتبا ووئائقها ونسبها الئوية 


1 | السياسة | 50560 47.896 13025 34.0% 50 45.45% 
2 | الاقتصاد | 11597 10.96% 4556 11.89% 10 9.09% 
3 | الفنون 11347 10.73% 5551 14.49% 10 9.09% 
ge 4‏ 11147 10.54% 5117 13.35% 11 10.00% 
3 العلوم 11290 10.67% 5401 14.09% 14 12.7396 


6 الرياضة 9840 9.30% 4671 12.19% 15 13.64% 


الجموع 105781 | 100.00% 38321 | 100.00% 110 100.00% 
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60.00% 
50.00% 
40.00% 
عدد الکلمات B‏ 
عدد الكلمات غير المکررة لا 30.0076 
ax‏ الوثائق E‏ 
20.00% 
7 0.00% 
الرياضة الاجتماع الاقتصاد 
الشکل:۳ التمثيل البياني لنسب عدد الکلیات الإجمالية والكلمات غبر المكررة وعدد الوثائق وفق 
التصنيف المجالي 


الملاحظ أن أنصبة التوزيع النسبي للکلیات وعدد الوثائق» والكلمات غير المتكررة 
ميل إلى الثبات أو الاستقرار - في مجالات عينة الدراسة - أي وجود علاقة شبه ثابتة 
بين حجم النص» وعدد المفردات غير المتكررة فيه» وعدد الوثائق. وهذا مايؤكد صدق 
تمثيل العينة المختارة (المدونة اللغوية) من المجتمع اللغوي غير المحدود. '' 


۵ التهيئة الآلية للمدونة اللغوية - عينة الدراسة - قبل إجرائها 
يلزم لتهيئة النصوص OTT‏ جعلها في صياغة Ea)‏ بحيث يكون لديا قابلية 
للتعامل مع الأساليب البرمجية المختلفة للمعالحة الآلية للغة الطبيعية؛ وذلك تمهيدًا 


^ 


لتوظیفها في التطبیقات التی تناظر الأداء الانساني. وتر تهيئة النص UIT‏ بعدة مراحل: 


A t 


Text Editing مریر النص‎ ۱-۰ 


يقصد بتحریر الت تحویل البیانات atl‏ التناثرة عل الشبکة العتكبوية آو de‏ 
صفحات الویب إلى بیانات نصية منتظمة Q‏ ملفات Text Document Za‏ بامتداد 


(۱) تم حصر مفردات الدونة اللغوية -عينة الدراسة - باستخدام أداة vel Sz‏ لمعالحة الدونات اللغوية» التي تم تطویرها 
تحت مظلة مدينة الملك عبد العزیز للعلوم والتقنية. 


(Y)‏ صياغة رسمية أي قابلیتها للأسس والبادی التي تقوم علیها التقنیات الحاسوبية. 


عد 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


dot TXT‏ ۰ بحيث يسهل التعامل معها بالتعديل أو الحذف. وتعالج هذه الملفات 
باستخدام المحررات النصية مثل Notepad‏ أو Notepad++‏ 


۲-۵ حذف المسافات الزائدة Remove Spaces‏ 
وتقتضي المعالحة الآلية للغة الطبيعية حذف المسافات asl JE‏ - في أول السطر أو بين 
الكلمات أو في نهاية السطر - الناتجة عن عدم الانضباط في عملية إدخال النصوص؛ 
لان السافة الاد تعد حر خا زاكذاء أو کلمة ژاقدة. 
وقد استخدمت الدراسة التعبيرات النمطية SİL” Regular Expressions‏ 
المسافات الزائدة في نصوص المدونة اللغوية من خلال النمط الآتي: 
sed-i ‘s/^[\ 1#//;s/[\ 1۵ //۶ /^UN [#5 /d' file.txt‏ 


۲-۵ توحيد علامات التر قيم Punctuation Normalization‏ 

يلزم توحيد الرموز المتماثلة في الشكل مثل علامات الترقيم؛ حتى يتمكن الباحثون 
في معالجة اللغة العربية OT‏ - لا سیم في بناء الناذج الإحصائية للغة الطبيعية - من 
حد الضوضاء وتناثر البيانات» حيث تتداخل علامات الترقيم اللاتينية مع علامات 
الترقيم العربية أثناء إدخال النصوص العربية إلى الحاسوب؛ نتيجة لعدم إدراك مُدخل 
النصوص إلى الحاسوب؛ ریما للتشابه الشكلي بين هذه العلامات» فعلامات الترقيم في 
العربية هكذا ؟ ۰ ؛ : () - .؛ آما الإنجليزية فهكذا ؟ و :: () -.. 

وقد تمت عملية توحيد علامات الترقيم في نصوص مادة المدونة اللغوية من خلال 
إحصاء كافة الرموز الواردة في المدونة» ثم استبدال علامات الترقيم العربية بعلامات 
الترقيم اللاتينية الواردة في النصوص. 


Notepad الإصدار الأحدث من محرر النصوص نوت باد‎ CY) 

(۲) التعبيرات النمطية أو ما تسمى بالريجكس Regex‏ هي تعبيرات نمطية تستخدم لاجراء عمليات إجرائية على 
النصوص مثل الاستبدال أو الحذف أو البحث....» بحيث يمكن مطابقة عدد كبير منها بأقل وصف ممكن من التعبير 
النمطي. وتستخدم في العديد من المنصات البرمجية platforms‏ مثل وجهة سطر الأوامر أو برامج تحرير النصوص 
مثل ++Notepad‏ وغيرها. 


ò=‏ “ات 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


Numbers Normalization قام‎ Au تو‎ ٤-٥ 
إن المزج بين الارقام الهندية والأرقام الانجلیزیة- التي أصلها عربية - في النصوص‎ 
العربية يمثل تحديًا كبيرًا في معالحة اللغة العربية آليا؛ لذا التزمت الدراسة بتوحيد‎ 
الأرقام بصيغة الأعداد الهندية» ”حيث إن الأعداد الهندية أكثر ملاءمة من حيث الشكل‎ 

وطابعها اليميني مع اتجاه كتابة النصوص (URS all‏ 

وقد تم توحيد الأرقام في نصوص مادة المدونة اللغوية من خلال عملية استبدال 
الأرقام الهندية بالأرقام الإنجليزية الواردة في النصوص. 

Tatweel removal إزالة الكشيدة‎ o— o 


هي زائدة تضاف بين حروف الكلمة» بغرض مساواة النص في الخط العربي» وأحيانًا 
تضاف في النص دون فائدة إلا أن وجودها في النص يمثل تحديا كبيرًا في LU‏ الآلية 
للغة العربية؛ Le‏ تؤثر على شكل الكلمة أثناء المعالجة؛ لذلك تم إزالتها من نصوص 
المدونة اللغوية - عينة الدراسة - من خلال عملية الاستبدال. 
وتظهر الكشيدة أو التطويل بين الحروف بهذا الشكل () كا JAL‏ التالي الذي 
يعرض شكل الكشيدة في الكتابة العربية وتعددها بين الحرف والآخر: 
معالحة اللغة الطبيعية 


00000000 2 , , 00000000 ,, 00000000 


0000000000 2 , , 200000000000 ,, 0000000000 


Text Encoding تشفير النصوص‎ 1-0 


یقصد بتشفیر النصوص تدید آکواد ثاتبة میم الحروف» وعلامات التشکیل 
الأساسية» وعلامات الترقيم» والأرقام» والرموز الستخدمة في النص. وقد تعددت نظم 


Y ینظر: علي (نبیل): اللغة العربية والحاسوب» ص۱۵‎ )١( 


E am 


إهداء من المركز 

تشفير النصوص" حيث وضع لكل نظام أكواد خاصة؛ ما دى إلى اختلاف نظم التشفير 
باختلاف بيئات التشغيل وألفبائية اللغة الستخدمة. إلى أن ظهرت نظم تشفير موحدة 
تدعم العديد من ألفبائيات اللغات الطبيعية» وأهمها نظم التشفير الموحدة Unicod‏ ۳ . 

وقد اعتمدت الدراسة في تشفيرنصوص المدونة اللغوية على صيغة UTF-8 ) 8-bit‏ 
(Unicode Transformation Format‏ ”وهي صيغة تحويل نظام الحروف الدولي الموخد 
بقوة ۸ بت ۳۳ الخاضعة لمعايبر آیزو 150 التي آقرتها النظمة الدولية للمعايير القياسية 
.International Organization for Standardization‏ وتدعم هذه الصيغة العديد من 
ألفبائيات اللغات الطبيعية» كا تدعم - آیضا- العديد من نظم التشغيل المختلفة. ^ 

وعلى الرغم من أن هذا الترميز يوفر البنية الأساسية لتهيئة الحروف العربية للمعالجة الآلية 
فإنه يعيبه تقارب أشكال بعض الرموزء إذ يقدم عدة تمثيلات لنفس الرمز بصيغة متقاربقه 
بحيث لا يمكن تييزها بسهولة» ومثال على ذلك حرف ”ك“ العربي» وترميزه (U-0643)‏ 
وحرف ”ک“ الفارسي؛ وترميزه (U06A9)‏ كلاهما يملكان الشكل الأول حرف C$)‏ “0 

ویوضح الشکل رقم ؛ الرموز الستخدمة في صيغة الترمیز أو التشفیر الوحدة 
1711-8 لالفبائیات اللغة العربية والانجليزية وفقا لعاییر منظمة ISO‏ . 


(V)‏ تعتمد تقنیات معالجة اللغات الطبيعية للغة العربية — بصفة رئیسیة- على آحد النظم الآتية: 
١‏ -نظام الترميز الوحد 71۳-8): صيغة التشفیر الوحدة لجميع الألفبائيات للغات الطبيعية» وجدير بالذکر أن صيغة التشفیر 
UTF-8‏ اكتسبت صفة العالمية -عمليًا- إذتمثل حوالي ZAY‏ من الصفحات المشفرة بهذه الصيغة على الشبكة العنكبويتة. 
-Y‏ نظام ترميز 1256 :(CP-1256) Code page‏ صيغة تشفير خاص لنظام Windows‏ تدعم اللغات الشبيهة للألفبائية 
العربية مثل اللغة العربية» الفارسية» والأردية» إلا أا لا تخضع لمعايير المنظمة الدولية أيزو ISO‏ 
۳- نظام ترميز ISO-8859-6‏ :صيغة تشفیرتستخدم في ترميز الحروف العربية» وقد طورتها منظمة المقاييس العربية. ينظر: 
Habash , N. (2010). Introduction to Arabic Natural Language Processing, A Publication in‏ 

the Morgan & Claypool Publishers series.P.19. 
الرمز العالي الوحد الذي يحوي ۱۵۵۳ حرفاء وقد تم تخصيص حوالي ۳۶۰۰۰ حرف‎ Unicode أصدرت منظمة‎ (Y) 
.۷ مجمع اللغة الأردني-عمان» ۱۹۹۲ ص‎ ile منها للغات الحية. ینظر: خضر(محمد ذكي): الحروف العربية واحاسوب.‎ 
أي طول مساحة تخزين الحرف الواحد في ذاكرة الحاسوب يماثل ۸ خانات من العدد الثنائي ۰ و ۱ - وهي طول‎ )۳( 
احتمال ختلف يخزن البت إحداها من‎ ۲۹۲-۸ Y بت- وتتكون وحدة البايت‎ A je مساحة وحدة البايت التي تحتوي‎ 
۰۱۱۱۱۱۱۱۱ و ی‎ 
.۵۱ السعید (العتز بالله): مدونة معجم تاريخي للغة العربية « معالجة لغوية حاسوبیة»» ص‎ CE) 

(5) Habash , N. (2010). Ibid. 0. 


E 


هذه الطبعة 

إهداء من المركز 

ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


00 01 02 03 04 05 06 07 08 09 0A OB OC OD OE OF 


90 
0000 | 0001 | 0002 | 0003 | 0004 | 0005 | 0006 | 0007 | 0008 | 0003 | 000A 000C | 000D | 000E | ۴ 
ot 0016 i 8 0019 pr oie 0010 
z 5 bud اس‎ 0027 1 jx 002A hod "M: s 
ES 1 7 4 4 E ۸ 1 zs 0038 1 0030 003F 

(4 79 x 4 M dx EA 3 
0060 e تا‎ i 5 e" 3 1 MA i» 006A E! E " M 3 

10 


0070 | 0071 | 0072 m ud ax M es L^ M 0070 | 007E | 007F 


vd 
06 F 
24 e ks 2D | 062E | ۲ 
es E LA an 0635 | 0636 ا‎ 3 2 063A 
0641 | 0642 | 0643 i M M "^ 0648 
0650 


لشکل:؛ الرموز الستخدمة في صيغة التشغير أو الترمیز UTF- E‏ 20 


يلاحظ أن لكل حرف أو علامة ترقيم أو رمز كودًا يتكون من أربعة أرقام أو أرقام 
وعلامات» ويتم تكوين هذه الرموز الرباعية لكل حرف وفقا للثنائية الرأسية والأفقية 
التي وضعتها المنظمة الدولية للمعاییر O,‏ 


(1) Unicode UTF-8. (2015). https://msdn.microsoft.com/en-us/goglobal/cc305172 
هذه الرموز من الهم جدا أن یکون اللغوي على دراية بهاء ]3 قد یواجه بعض الشکلات في التشفیر التي لاتظهر بشکل‎ 
مباشر أثناء معالجته لبعض النصوص.‎ 
من خلال تظلیل‎ Office Word یمکن معرفة الشفرة الخاصة بکل حرف أثناء كتابتك في برنامج آوفیس ورد‎ (Y) 
.ALT+X الحرف» ثم الضغط على زري‎ 


A= 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


وقد استعانت الدراسة بمحرر التصوص ++21016030 O‏ لتشفير نصوص المدونة 
اللغوية بصيغة .UTF-8‏ 


Orthographic Transliteration „LSI التمثيل‎ ۷-٥ 


لجأ العديد من الباحثين في معاة اللغة العربية CIT‏ إلى استخدام التمثیل الکتایی؛ 
CË‏ للتحديّات الناتجة عن ترمیز الیونیکود „Unicode‏ «وهو عملية نقل هجائي من 
لغة ما إلى هجاء لغة آخری» وفقا لعیار أنظمة کتابتها.» O‏ 

وتستخدم عدة أنظمة للتمثيل الكتابي في معالجة اللغة العربية J‏ 
باكولتر الكتابي (Transliteration Buckwalter)‏ الذي c‏ الترمیز العياري للحروف 
العربية» بحيث يقابلها أي الحروف والعلامات العربية رمورٌ - في أغلبها — إنجليزية؛ 
لتکون أكثر موثوقية في اكتشاف أخطاء ترمیز الیونکر و “° 

ويعرض الجحدول رقم Y‏ رموز نظام باكولتر الكتابي بمقابلاتها العربية: 


2 
0 


> آشهرها نظام 


(۱) للمطور الفرنسي «دون هو» Don Ho‏ الذي اعتمد على مكونات محرر Scintilla editor‏ المحرر بلغة السي بلس 
بلس البرمجية ++ في تطوير هذا المحرر؛ ليعمل على بيئة التشغيل ويندوز. يمكن تحميله من خلال هذا الرابط: 
Notepad++. (2015). http://notepad-plus-plus.org/‏ 
(Y)‏ وهناك مقابل آخر لصطلح » “Orthographic Transliteration‏ وهو ”النقحرة“. 
Habash , N. (2010). Ibid. P.20.‏ )3( 
Habash , N. (2010). Ibid. 11‏ )4( 


-¥q-— 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


icode Buckwalter CP- ISO- Unicode 
Letter Name ba m ET 1256 8859-6 
Hamza 0621 
Alef Madda Above 0622 


Alef Hamza Above 0623 
5 Waw Hamza Above 0624 
Alef Hamza Below 0625 
Yeh Hamza Above 0626 
F 0627 
0628 
Teh Marbuta 0629 
062A 
5 Theh 062B 
i j j 062C 
062D 
062E 
062F 
0630 
0631 
0632 
0633 
0634 
0635 
0636 
0637 
0638 
0639 
063A 
0641 
0642 
0643 
0644 
0645 
0646 
0647 
0648 
Alcf Maksura 0649 


جدول: ۲ آنظمة التمثيل الكتابي المختلفة للأحرف Vay ydi‏ 


Arabic 


| 


3 
D 

a 
25 


سا 
۲ 


(1) Habash , N. (2010). Ibid. 5۰ 


وات 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


Arabic Unicode HSB Buckwalter CP-  ISO- Unicode 
Letter Name a | ی ا‎ [0525613 11585956 
n TTT 
mm o 535 533 535 31 20 e 
EHI CENENESESESESE-RE:: 
am erefa IRIE 
EE LE ER 531 531 KELA 55 
هت لاصتا‎ NE: 
pa 1 51 53 51 51 5 
ككل‎ E ES ES KS IR LS RR M: 
pem 531 51 551: 531 5 | ® 
[i [mma | ابا یل اه‎ | | m 
= pim 551 55 55 55 2 T s 
om Lr le rl ae 
me 591 531 5 mm am 
EE LE ESSEN LISLINE 
si 
no 530 531 531 391 1 2 
TE CUT ® 
Sa 1530 530 531 531 1 D 

Gaf g G G G 90 


06AF 


وما بهمنا - في هذا الصدد- من العلومات الواردة في dado Ma‏ هي 1 
العربية وعلامات التشکیل والرموز الستعملة في النصوص فحسب. ومقابلات ذلك 
نه ربا کر ان ERE‏ تام امورل 

وقد استعانت الدراسة بأداة تحويل رموز باکولتر إلى الرموز العربية script‏ 
C? buckwalter2unicode‏ للمطور البريطاني آندرو روبرتس Andre Roberts‏ وذلك 


لتحویل نصوص الدونة اللغوية — عينة الدراسة- إلى نظام باکولتر الكتابي. وقد خرّرت 


(۱) قمت بتعدیل طفیف داخل هذه الأداة لعکس عملية التحویل من رموز باکولتر إلى الرموز العربية؛ لتتوافق مع ما 
یستهدف البحث. 


"Xt 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


هذه الأداة بلغة البایشون البرمجية Python‏ ۱ ك| تدعم العدید من بیئات التشغیل التعددة. 


۸-۵ اعادة تسمية Files Rename cU‏ 
وتتجل أهميّة توحيد صياغة تسمية الملفات؛ لتهیتتها للعتاد البرمجي» بحيث تسهل 
قراءتها لدی آنظمة التشغيل المختلفة أثناء المعالحة الآلية. وكانت اة امقر حة 
لملفات النصوص بالترتيب الآتي: اسم البناء_ اسم مصدر المادة_ اسم المجال_ التاريخ_ 

رقم الملف. الامتداد. 
ويوضح الشكل رقم 0 تسمية ملفات نصوص المدونة وفق التسمية المقترحة: 


|_| SATB IOL Spo 2015 202,54 10/18/2014 8:06 PM Text Document 1 KB 
|_| SATB IOL Spo 2015 0003.txt 10/18/2014 8:06 PM Text Document 1KB 
L] SATB IOL Spo 2015 0004.bxt 11/14/2014 3:43 AM Text Document 2KB 
|_| SATB IOL Spo 2015 0005.txt 11/14/2014 3:25 AM Text Document 1 KB 
|_| SATB IOL Spo 2015 0006.txt 11/14/2014 3:43 AM Text Document 3KB 
|_| SATB IOL Spo 2015 0007.txt 11/14/2014 3:43 AM Text Document 2KB 
|_| SATB IOL Spo 2015 0008.bt 10/18/2014 8:07 PM Text Document 1KB 
|_| SATB IOL Spo 2015 0009.txt 11/14/2014 3:43 AM Text Document 2 KB 
|_| SATB_IOL_Spo_2015_0010.b¢t 11/14/2014 4:00 AM Text Document 1 KB 
|_| SATB_IOL_Spo_2015_0011.bt 11/14/2014 4:00 AM Text Document 1 KB 
تسمية ملفات النصو ص‎ e: شکل‎ 


حيث تعنی SATB‏ اسم البناء القتر Syntactic Arabic TreeBank e‏ وذلك 
مقاربة من عنوان البناء (بنك شجري نحوي)» آما 101 فتعني اسم مصدر الادة (إسلام 
آون لاين es « Islam On Line‏ تعني Spo‏ اسم الجال الرياضي .Sport‏ 

وقد استعانت الدراسة بأداة بالك الساعدة لاعادة التسمية ? Bulk Rename‏ 
Utility‏ في تسمية ملفات نصوص الدونة اللغوية» إذ یمکن من خلاها تسمية عدد كبير 
من اللفات في وقت واحد. 


O)‏ لغة البایشون Python‏ لغة برمجية» تم تطویرها من قبل جویدو فان رزوم في آواخر الثانينات من القرن النصرم في 
مركز CWI‏ بأمستردام» وتعد لغة البایشون من لغات الستوی العالي» وقد استخدمت مؤخرًا بشکل واسع في العدید من 
الجالات. لا سيم في معالجة اللغات الطبيعية. 

(Y)‏ للمطور الأمريكي جيم يلشير «Jim Willsher‏ وهي من ضمن البر oke‏ المفتوحة الصدر Open Source‏ ۰ وتعمل على 
بيئة التشغیل ویندوز Windows‏ . ویمکن تحمیلها من خلال الرابط التالي: 
Bulk Rename Utility. (2015). http://www.bulkrenameutility.co.uk/Download.php‏ 


EL 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الميحث الثانی 


تجزئة التصوص 


Tokenization مفهوم تجزئة النصو ص‎ .١ 

يعتقد الباحثون في العلوم العرفية أن إدراك الخ البشري للنص اللغوي وفهمه يتم 
من خلال تقسيمه إلى مكونات أو وحدات منفصلة» ثم تنظيمها بطريقة متسلسلة» 
بحيث تعمل الواحدة تلو الأخرى في الدماغ البشري. 

وما يؤكد هذا الزعم أن تحليل النص لخويًا يتطلب مرتكرًا أساسيًا وهو تفكيك الوحدة 
النصية إلى مکوناتها الجزئية» بحيث تتيح UJ‏ معرفة بنياتها الداخلية» وإن توخي التحليل 
النحوي يتصل بتحليل الجملة إلى عناصرها الأولية للكشف عن علائقها وربط مكوناتها. 

d‏ اطار محاكاة الذ کاء الا صطناعي للمخ البشري في حلیله cil‏ وإدراكه لعناصر 
الترکیب اللغوي» استمدت آسالیب التعلم الآلي فكرتها من إدراك المخ البشري للنص 
اللغوي» التی تنطلق من تجزئة السلسلة النصية Text string‏ إلى وحدات لغوية» ثم 
معالحتها في خطوات تتابعية؛ لنمذجة الاستعمال GUI‏ للغة. 

ويشير مفهوم تجزئة التصوص إلى تقسیم النص -آليا- إلى وحدات منفصلة من 


er. 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاريا 


خلال ile‏ من المعطيات اللغوية اللازمة التي تكون دليلا مستأنسًا للحاسوب في 
تعيينه إلى هذه الوحدات M‏ 

وتنطلق معظم تطبيقات معاحة اللغات الطبيعية» مثل معنونات الأقسام الكلامية 
POS-taggers‏ والمحللات النحوية Syntactic Parsers‏ والمجذعات Stemmers‏ 
من النص القسّم إلى آجزاء/ عناصر. وتشمل هذه الأجزاء الکلیات والأرقام وعلامات 
الترقیم والرموزء وغیرها من الوحدات المكوّنة للنص. O‏ 

إذا كانت تجزئة النصوص هي الطلب الرئیسی لتطبیقات معاحة اللغة الطبیعیق 
فان دقة هذه التجزنة تتعکس عل آداءالتطبیقات اللغوية. ویوضح الشکل رقم 7 مدی 
انعکاس آداء تجزئة النصوص على آداء التحلیل النحوي. 


Text Raw 


اتن الخاد 


Tokenization 


POS-Tagging 
العنونة الكلامية‎ 


Syntactic Parsing 


التحلیل النحوي 


الشکل:" خطوات عملية التحلیل النحوي. 


(1) Attia, M. (2007). Arabic Tokenization Systems. In proceeding of ACL. 2.65. & Soudi, A. 
Bosch, A. Neumann, G”. (2007). Arabic Computational Morphology Knowledge-based and 
Empirical Methods. Springer. P.32. 


(2) Lüdeling, A. & Kytó, A. (2008). Ibid.P.527. 


c $c 


هذه الطبعة 
إهداء من المركز 
ولايسمح بذ شرها ورقياً 
أو تداولها تجارياً 


Y‏ . مستويات تجزئة نصوص المدونة اللغوية عينة الدراسة 

إن الهدف المنشود من هذه الدراسة هو التحليل النحوي للعربية الفصحى ا معاصرة 
المرتكز على المفاهيم النحوية التي تعد منطلقا أساسيًا للفهم الأتوماتي للنص اللغوي؛ 
لذلك فان .52 35 التصوص قد اشتملت عل ثلاثة مستویات أساسية: 


۱-۲ التجزئة على مستوى الجملة 

«تعد الجملة من الناحية النحوية الوحدة المحورية لبنية النص». O‏ غير أن مفهوم 
الجملة ليس واضخا إلى الآن» فقد اضطربت تعريفات الجملة لدى النحاة اضطرابًا 
تین واتسعت مذاهبهم تارة لاعتمادهم على أساس الناحية اللفظية المتمثلة في فكرة 
العامل» وآخری لانطلاقهم من الناحية الدلالية. وفي ضوء هذه النطلقات لتعریف 
الجملة یتضح الا ختلاف في تحدید آبعاد O ilh‏ 

وتتصل تجزئة الجملة بشکل عام بالتعزف على معیار تحدید آبعاد الجملة الذي 
یمثله مقیاس الشکل النحوي أو العنی التام. ويتم التقسیم - في تحدید آبعاد الجملة في 
المدونة اللغوية عينة الدراسة- حسب الاسناد والتركيب التام المفيد» وما بين الجمل من 
علاقات الربط بواسطة آدوات الاستئناف والعطف. 

ثم كان الانطلاق من علامات الترقيم لاسي| علامة النقطة» والاستفهام والتعجب خير 
سبیل لتحدید هذه الأبعاد الجملية -تحدیدا -ÉKE‏ في نصوص الدونة اللغوية إذ تتخذ آلية 
x‏ التصوص Tokenizer‏ من علامات d] lE uet a‏ جمل منفصلة. de‏ 

الا أن هذه الآلية تحتاج إلى تتمة الأدلة لیکتمل فیها من الحددات التي تبلغ حد الكفاية 


(۱) برینکر(کلاوس): التحليل اللغوي للنص» مدخل إلى المفاهيم الأساسية والناهج ترجمة: أ.د سعيد حسن البحيري» 
مؤسسة الختار للنشر والتوزيع» ۰۲۰۱۰ ص٠٤‏ . 
(Y)‏ تعددت اتجاهات تعریفات الجملة» حیث آقام النحاة درسهم للجملة العربية على أساس الناحية اللفظية التمثلة في 
الاعراب وفكرة العامل» فقسموا الأبواب النحوية وفق هذه الناحية إلى مرفوعات ومنصوبات وجرورات ومجزومات» 
وقد دفعهم هذا المنهج إلى الانطلاق في درسهم من البنی؛ لیصلوا إلى العنی إلى أن جاء عبد القاهر الجرجاني في کتابه 
دلائل الإعجاز بنظرية تركيبية تنطلق من المعنى وصولا للمبنى أي باتجاه يتفق مع عملية الاتصال اللغوي.ينظر: حميدة 
(مصطفی): نظام الارتباط والربط في تركيب الجملة العربية» مكتبة لبنان -ناشرون» ۰۱۹۹۷ ص ۲. حول أبعاد الجملة عند 
النحاة القدماء. ينظر: عاشور(المنصف): السابق» ص١ Y 07 Y‏ ينظر: عبادة (محمد إبراهيم). الجملة العربية» مكوناتها- 
أنواعها- تحليلهاء مكتبة الاداب القاهرق ط (E‏ ۲۰۱۰۷م» ص ۳۲-۲۹ 
Habash, N. Faraj, R. & Roth, R. (2009). Syntactic Annotation in the Columbia Arabic‏ )3( 
Treebank. In Proceeding of ELDA.P.125.‏ 


Oc.‏ و2 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


في تجزئة النص إلى جمل؛ لما في علامات الترقيم من لبس يشوبهاء فقد تعددت وظائفها 
في النص الكتابي بين وظيفتها الأساسية وما يتفرع منهاء فعلى سبيل المثال لا احصر 
النقطة التي تستخدم كمحدد للدلالة على هاية الجملة» تستخدم بين الاختصارات مثل 
أ.د» ص.د.ب. وغيرهاء وكذلك الفاصلة التي تعد ملمحا میزا للفصل بين الوحدات 
آوالکونات في الجملة» تستخدم حال الارقام العشرية. 

ويدفع الباحثون اللبس الناتج عن تلك الأطر باللجوء إلى أساليب الذكاء الاصطناعي؛ 
لقدرتها على استدعاء الاحتمالات لتلك الأطر» ومواجهتها للتعامل مع حالات اللبس المتعددة. 

ومن تلك الأساليب الإحصائية لمواجهة الاحتمالات المتعددة في هذا الإطار المصنفات 
الثنائية binary classifiers‏ التي تندرج تحتها تقنية مشجرات اتخاذ Decision" j| 3l.‏ 
9ه حيث تعتمد تلك التقنية على تحديد خواص العلامات» وإعادة ترتيبها في صورة 
شجرية متدرجة؛ ويشكل التنسيق بين هذه الخنواص تصورًا يؤدي إلى تحديد الفثات من حيث 
التجزئة أو عدم التجزئة'". ويوضح الشكل رقم V‏ صورة توضيحية (شجرية) لتحديد 
خواص العلامات» ومن ثم تحديد تصنيف حالة الجملة من حيث نهايتها أو عدم نهايتها. 


Not 8-0-5 E-O-S 


الشکل: ۷ تحدید الكلمة النهائية في الجملة- من خلال الخواص- باستخدام مشجرات اتخاذ القرار. ۲۳ 


(1) Nugues, M. (2010). An Introduction to Language Processing with Perl and Prolog: An 
Outline of Theories, Implementation, and Application with Special Consideration of English, 
French, and German (Cognitive Technologies).Springer.P.82. 
(2) Nugues, M. (2010).Ibid.P.82. 

۰۱۱ السعید (العتز بالله): مدونة معجم تاريخي للغة العربية « معالجة لغوية حاسوبیة»» ص‎ DES 
بجامعة ستانفورد.‎ Dan Jurafsky & Chris Manning مقتبس هذا الشکل من محتوى مادة معالحة اللغة الطبيعية التى يقدمها كلا من‎ )۳( 


=ý 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


حيث تعنى End Of Sentence‏ = 2-0-5 قرار xl.‏ الجملة الذي تؤسسه 
خوارزمية مشجرات اتخاذ القرار بناءً على خواص علامات الترقيم في الجملة من حيث 
كونها علامات للدلالة على انتهاء الجملة أو علامات لتكوين الاختصارات. 

وقد استعانت الدراسة بآلية التجزئة الدرجة في محلل ستانفورد النحوي Stanford‏ 
1 التابع لفريق معالجة اللغات الطبيعية بجامعة ستانفورد؛ لتجزئة نصوص 
المدونة اللغوية إلى جمل منفصلة. إلا أا لا تدعم حالات اللبس الناجمة عن تلك الأطر 
المتمثلة في علامات الترقيم. وقد أمكن التعامل مع هذه الحالات- التي سبق ذكرها- في 
المدونة اللغوية بالمعالجة اليدوية. 


۲-۲ التجزئة على مستوى الوحدات/ العناصر الرئيسية 

العنصر اللغوي Token‏ هو أصغر وحدة نحوية» يمكن أن تكون كلمة أو جزءًا 
من الکلمت أو تعبية| اضطلاحياء آو مركا آو رمرّاة ومادامت العناصر اللغوية 
الرئيسية هي الجزء اللموس من التحلیل فیمکن أن نطلق علیها آیضا "وحدات 
التحلیل النتحوي*. 

والوحدة الرئيسة هي البناء اللغوي التکامل سواء أكانت كلمة أو علامة أو Ey‏ 
وتعد عنصرًا آساسیا في النص اللغوي. و تشتمل التجزئة على مستوی الوحدات أو 
العناصر الرئيسية Main Tokens‏ على ثلاثة مستویات: 


۱-۲-۲ الکلمة 
تعرّف PUII‏ في اصطلاح اللغویین بأنها“ صيغة ذات وظيفة لغوية معينة في 


)١(‏ یمکن تحميله من خلال هذا الرابط: 
Stanford-parser. (2015). http:;//nlp.stanford.edu/software/lex-parser.shtml‏ 

(2) Attia, M. (2007). Ibid.P.65. 
الشكلية لکلام العرب» نظرية وتطبيقا دراسة بنيوية» مؤسسة الثقافة الجامعية»‎ BEYI شمس الدین(جلال):‎ )۳( 
Moe ۱۹۹۵ ۱ الأسکندرية ط‎ 
آصغر وحدة حرة» ومعنی هذا أن الكلمة عنده هي‎ leb Bloomfield وقد عرفها أيضًا العام الأمريكي»بلومفیلد»‎ )5( 
آصغر وحدة لغوية يمكن النطق بها معزولة» كا يمكن استعیها لتركيب الجملة أو الکلام» ويجب أن تتکون من مورفیم‎ 
على الأقل. ينظر:‎ Free Morpheme حر‎ 
Moe ۱۹۹۸ خليل (حلمي): الكلمة دراسة لغوية معجمية دار المعرفة الجامعية» الأسكندرية»‎ 


بت 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


تركيب الجملة» تقوم بدور وحدة من وحدات العجم وتصلح oy‏ تفرد» أو تحذف» 
أو تحشى» أو يغير موضعهاء أو يستبدل بها غيرها في السياق» وترجع مادتها غالبا إلى 
أصول 2:945( 

Ul‏ عرف الحاسوب» فهي xm‏ من الحروف المتشابكة» أو الحروف المفردة أو 
العلامات. أو الرموز» يحيطه من جانبيه مساحات بيضاء .White Spaces‏ وهذه 
المساحات هي المعطيات التي تفضي إلى حدود الكلمة لتجزئة الوحدات الرئيسية في 
MAS‏ 

وثمة عدید من آليات تجزئة النصوص إلى وحدات رئيسية -وغالبًا هذه الالیات يتم 
إدراجها في الحللات النحوية - منها: 


۱-۱-۲-۲ آداة التجزئة العربية Arabic Tokenizer‏ . 
عمل فریق معالجة اللغات الطبيعية بجامعة ستانفورد على تطوير هذه الأداة - 
الحورة بلغة GLH‏ البرمجية -O Java‏ باعتبارها جزءًا آساسیّا من الحلل الترکیبی الذي 


يعمل على تجزئة الوحدات الرتيسية للنص المدخل» ومع ذلك یمکن استخدامها منفردة. 
وقد دعمت هذه الأداة الحروف العربية الشفرة بصيغة ۰071۳-8 ى| تدعم العدید من 


cols‏ التشغیل التعددة. ویوضح الشکل رقم ۸ صورة لواجهة آسطر الأوامر آثناء 
تنفيذ هذه الأداة على ملف نصی. 


Y حسان(تمام): مناهج البحث في اللغة» مكتبة الأنجلو القاهرة» ۰۱ ۰۱۹۵۵ ص‎ )١( 
(2) Jurafsky, D. & Martin, H. (2007). Speech and Language Processing: An introduction 
to natural language processing, computational linguistics, and speech recognition. Prentice 
Hall.P.26. & Habash, N. & Faraj, R. & Roth, R. (2009). Ibid. P. 125. & Warner, C. & 
Lanfranchi, A. & O'Gorman, T. & Howard, A. & Gould, K. & Regan, M. (2002). Bracketing 
Biomedical Text: An Addendum to Penn Treebank II Guidelines. Institute of Cognitive 
Science, University of Colorado at Boulder. P. 3. 
AE ینظر آیضا: السعید (العتز بالله): مدونة معجم تاريخي للغة العربية « معالجة لغوية حاسوبیةا؛ ص‎ 
هي لغة برمجية» قد تم تطویرها من قبل جيمس جوسلینج في ختبرات شركة صن میکروسیستمز‎ Java لغة الجافا‎ (Y) 
لاستخدامها في بناء الأجهزة التطبيقية الذكية مثل التيلفزيون التفاعليء‎ SC ++ امتدادًا للغة السي بلس بلس‎ e Y AY عام‎ 
الهواتف الذكية. ينظر:‎ 
Wikipedia The Free Encyclopedia. (2015). ۵۵2 


-fA- 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقياً 
أو تداولها تجاریا 


0 ahmed@ahmed-PC: -/Desktop/stanford-parser-full-2013-06-20 
ahnedgahned-PC:-$ cd /home/ahmed/Desktop/stanford-parser -full-2013-06-20 


ahnedgahned-PC: ^ /Desktop/stanford-parser-full-2013-06-20$ java edu.stanford.nlp. 


international.arabic.process.ArabicTokenizer «./Ahmed.txt »./foo. txt 
ntokenizable: 

Done! Tokenized 2 lines (134 tokens) 

ahnedgahned-PC:- /Desktop/stanford-parser - full-2013-06-20$ i 


الشکل:۸ آمر تنفیذ أداة التجزئة العربية Arabic Tokenizer‏ 


اه 
Rum Tetik Pogas Window 1 1‏ ما Fi Est Sech Ven Exodng Langage Sings‏ 
TENET]‏ ا 
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نزداد 1 
السعربة 2 


Nemaltetfie lengh: BS os: ll (1 0 Dele 4 K 


الشکل:٩‏ رجات أداة التجزئة العربية Arabic Tokenizer‏ ۲۱ 


CO‏ یمکن تحميله من خلال هذا الرابط: 
Arabic Tokenizer. (2015). http://nlp.stanford.edu/software/lex-parser.shtml‏ 
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هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقياً 
أو تداولها تجارياً 


يظهر في الشاشة الأولى أو طرفية واجهة أسطر الأوامر Command lines‏ أمرٌ تنفيذ 
أداة التجزئة العربية المتضمن عنوان الملف النصى المراد تجزئته» وكذلك نتيجة التجزئة 
أو عدد الوحدات الرئيسية التي تم تجزئتهاء أما في الشاشة الثانية فتظهر الملف (go:‏ 


بعد تجزئته إلى وحدات رئيسية. 

۲-۱-۲-۲ آلية تجزئة الوحدات الرئيسية Main Tokens.py‏ 

عمل الباحث على تطوير هذه الآلية - باستخدام لغة البايثون البرمجية Python‏ 
- لتجزتة الوحدات الرئيسية في النص» مدعمة الخروف العربية الشفرة ب 11۳-8 


كا تدعم العديد من بيئات التشغيل المتعددة. ويعرض الشكل رقم ۱۰ أسطر الأداة 
البرمجية ” الكود“ داخل واجهة بايثون IDLE Python‏ لكتابة أسطر الأوامر. 


é Main Tokens.py - C/U 


File Edit Format Run Options Windows Help 
$ -*- coding: UTF-8 -*- 
$ Arabic Tokenizer for Main Tokens 
import codecs 
f-codecs.open("Text3.txt","r","urtf-8") 
for word in f.read().split(): 

print (word) 


الشکل:۱۰ واجهة بايثون لکتابة آسطر الأوامر آسطر — كود — آداة 552 الوحدات الرئيسية Main‏ 
Tokens.py‏ 


دح 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


— " 
File Edit Shell Debug Options Windows Help 


Python 2.7.3 (default, Apr 10 2012, 23:31:26 ^ 
) [MSC v.1500 32 bit (Intel)] on win32 

Type "copyright", "credits" or "license()" f 
or more information. 


RESTART 


الشکل:۱۱ رجات آلية تجزئة الوحدات الرئيسية Main Tokens.py‏ 
یظهر في الشاشة الأولي واجهة بايثون لکتابة أسطر الاوامر آسطر " كود“ آداة تجزئة 
الوحدات الرئيسية» متضمتا مکان اللف النصی الراد تجزئتهء آما الشاشة الثانية فتظهر 
اللف النصی بعد تجزئته إل وحدات رئيسية. 
( ۱۶ المركب غير الکلامی 


”هو انضیام كلمة إلى كلمة فأکش وتکون بحکم الفرد نحویا OIN s‏ مثل: عبد 
الله» جاب الله» آبو عيد» اسلام آون لاين» الصهیو أمريكيء الجيو إستراتيجية. 


(۱) الدحداح (آنطوان): معجم لغة النحو العربي» مکتبة QU‏ ناشرون» ۰۲۰۰ ص ۲۹٤‏ (بتصرّف). 


nes 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاريا 


فا الذي يبعث إلى انتهاج المركب غير الكلامي في المنهج المقترح للتجزئة؟ انا 
يتقرر ذلك في ضوء الدراسة النحوية للجملة التى تستدعی بنية متناسقة من الوحدات 
النحوية الدالة علی الوظيفية الى تحققها نی بنية املة. ‏ 

وتجدر الاشارة إلى أن a‏ الرکب غير الكلامي في نصوص الدونة اللغوية قد 
cd. ae‏ بالمعالجة اليدوية من خلال وضع علامة الشرطة (-) بين الكلمة الأولى 
والكلمة الثانية؛ ليكونا في حکم الكلمة الواحدة. ویوضح الجدول رقم ۳ ناذج من 
تجزتة الرکب غير الكلامي في نصوص الدونة اللغوية: 


ما قبل المعالجة اليدوية ٠‏ ما بعد المعالجة اليدوية 


عبد الله عبد- الله 


عبد الرمن عبد-الرهمن 
غلام الله غلام- الله 


الصهيو أمريكي الصهيو-أمريكي 


عطا الله عطا-الله 


عبد الحسن عبد- المحسن 


حزب الله حزب- الله 
أبو تريكة آبو-تريكة 
الجيو إستراتيجية ا حيو -إستر اتيجية 


الجدول :۳ معالجة المركب غير الكلامي في نصوص المدونة اللغوية 


= 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


۳-۲-۲ الرمز أو العلامة: 

يشمل جميع الرموز المستخدمة في النص العربي» مثل علامات الترقيم والارقام» 
وغيرها من الرموز. 

ووفقا لاعتبار البنية النحوية وحدة للتحلیل» استوجب على الدراسة توحيد نسق 
الأرقام والتواريخ في نصوص الدونة اللغوية» بحيث تمتلك حيرا ls US‏ على 
اعتبار أنها وحدة نحوية مفردة» وقد آفضی هذا التوحيد إلى إزالة الفراغات البيضاء بين 
الأرقام مع توحيد أشكالها. ويوضح الجدول رقم ٤‏ نیاذج من اتساق الأرقام المتعددة 
والتواريخ في نصوص المدونة اللغوية. 


ما قبل المعالجة اليدوية ٠‏ مابعد المعالجة اليدوية 


2,4 2,4 
21-1-08 2008 -1-21 
21-1-2008 1/2008 21 

30% % 30 

50-50 50 - 0 
19/4 4/19 
46-53% % 53 - 46 
0.11 0.11 
12 33 12,33 


الجدول:؛ معالجة الرمز أو العلامة في نصوص الدونة اللغوية 
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أو تداولها تجاریا 


۳-۲ التجزئة على مستوی الوحدات/ العناصر الفرعية 

یمکن أن نعرّف العنصر اللغوي آیضا بآنه“ بناء لغوي يحدده مستوی التحلیل ۴ 
|3 نجد أن العنصر اللغوي الرئيسي قد يكون مكوئًا من مورفیم/ عنصر فرعي واحد 
أو آکثر من مورفیم» فعلى سبیل الثال يمكن للكلمة الفردة (العنصر الرئیسی) أن تشمل 
آربع وحدات فرعية سواء آکانت سوابق أو لواحق. O‏ 

وتتوقف حدود عملية تجزئة العناصر الرئيسية إلى عناصر فرعية على طبيعة الغرض 
من البحثء أي ما العناصر الفرعية الراد تجزئتها من العناصر الرئیسیة؟ ویقتضی لتحلیل 
الجملة العربية تجزئة عناصر‌ها الأساسية التی تکوّن العلاقات النحوية في انا 

ولا كان الكلام سلسلة من الجزئيات اا كان Ul;‏ على تلك الدراسة أن 
تعرض آنوع تلك الجزئيات: 

ثمة آنواع من الورفیات اللصقية Concatenative Morphemes‏ في اللغة العربية: 
Stem))e A‏ واللواصق((3856<65 والزوائد (01165): © 

۱-۳-۲ الجذع Stem‏ : هو جزء آسامي من الكلمةء يأتي مشتقا أو جامدًاء وینتج 
عن اتحاد الورفیمات اللصقية للکلمة» ومن آمثلته: الجذع (کتب) الذي تکون عنه 
الترکیب في(وسيكتبونها) والجذع (مکتب) في صيغة الجمع (الکتبات). 

۲-۳-۲ اللواصق :Affixes‏ هي مورفییات تتعلق بجذع الكلمة» وهناك نوعان من 
اللواصق”: 

(Prefixes) gl gC‏ والسابقة مورفيم يسبق الجذع في أوله» ومن آمثلته: نون في 
الفعل الضارع في "نفعل- نعمل- نشكر“. 

۲)اللواحق (Suffixes)‏ واللاحقة مورفيم يلحق الجذع في آخره» ومن أمثلته: 
الواو والنون في جمع المذكر السالم في“ المسلمون-العاملون“. 


. 1۹ شمس الدين(جلال): السابق» ص‎ OD 
(2) Attia, M. (2007). Ibid. ۰ 
(3) Habash , N. (2010). Ibid.P.41. & Jurafsky, D. & Martin, H. (2007). Ibid.7. 
هناك نوع ثالث من اللواصق. لکنه یتوسط الجذعء ولا یتعلق به مثل آلف اسم الفاعل مثل كاتب» وهو الدواخل‎ CE) 
(Infixes) 
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۳-۳-۲ الزوائد 5انا): هي مورفییات نحوية تكون مقيدة بكلمات آخری؛ 
وتتعلق بجذع الكلمة بعد اللواصق. وهناك نوعان من الزوائد": 

١)الزوائد‏ في بداية الكلمة (Proclitics)‏ فهي تشبه اللواصق. ولكنها تختلف 
اختلافا واضحا عن اللواصق التي تمثل جزءًا من الكلمة G puo‏ وبنيويّاه ومن أمثلتها: 
حروف العطف» وحروف ار والنداء. 

۲)الزوائد في غباية الكلمة (Enclities)‏ وهي التي تعقب الکلمة» مثل الضائر 
المتصلة. 

وقد يكون القرار مربكا أحيانا في جعل المورفيم لاصقة صرفية أو زائدة نحویق 
ومع ذلك نستطيع أن نقول - عموما - أن اللواصق تحمل ملامح صرفية نحوية مثل 
(الزمن- الشخص - الجنس - العدد) بینا الزوائد تخدم الوظائف النحوية مثل(النفي 
- التعريف - العطف أو H‏ .0 


۱-۳-۲ المنهجيات المختلفة لتجزئة الزوائد Decliticization‏ في oJ!‏ 

تجري الزوائد النحوية 011665 في بناء الجملة العربية مجرى الأساس في البناء 
e‏ إذ هي ضرب من الملفوظات المكونة لأبنية الجملة» وتكون مرهونة بالوظيفة 
التركيبية في تواليها المختلفة. 

وما هو جدير بالذكر أن تعدد منهجيات تجزئة الزوائد النحوية Clitics‏ يخضع 
لطبيعة الهدف المأمول من تلك التجزئة» "فیا هو مناسب لنظم استرجاع المعلومات 
e‏ لا يتناسب مع نظم الترجمة الآلية الإحصائية» وهكذا“". ويعرض الجدول رقم ۵ 
بعضًا من منهجیات التجزئة الستخدمة في معالحة اللغة العربية آليا بشکل عام. 


(1) Attia, M. (2007). Ibid. ۰ 
(2) Attia, M. (2007). Ibid. P.65. 


(3) Olive, J. & Christianson, C. & McCary, J. (2011). Handbook of Natural Language 
Processing and Machine Translation. Springer. 2.85 1 . And Habash , N. (2010). Ibid.P.78. 
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Clitics .— 51,1 33; تج‎ 


D2 y y y V x 1 y 
D3/S1 y y y y y V V 
s2 ۷ | ۷ | N y 0 0 y 
WA x V x x x y x 
ATBold | ۱ V y x x N y 
ATB y V y V x N y 


الجدول:ه النهجیات الختلفة لتجرئة الزوائد النحوية. 


حیث تعنی (DI,D2,D3) © 3,2,1 Decliticization degree‏ بتجزئة الزوائد 
ذي col‏ الختلفة» فمنهجية الدرجة الأول 101 تقوم عل تجزقة (حروف العطف» 
وهمزة الاستفهام) من الزوائد النحوية» آما منهجية الدرجة الثانية D2‏ فتقوم على 5£ à‏ 
(حروف العطف. وحروف الجر الملتصقة بالكلمة» والسین التسويفية» وهمزة الاستفهام» 
والضائر)» بینا منهجية الدرجة الثالثة D3‏ تقوم على فصل الزوائد النحوية کلها. 


(1) Olive, J. & Christianson, C. & McCary, J. (2011). Ibid. P.81. 


- 


إهداء من المركز 

Segmentation degree 2 OXS1, S2,) GÍ‏ تعنيان بتقسيم الزوائد ذي الدرجات 
الختلفت فمنهجية الدرجة الأولى والثانية 51 52 تتشابه مع منهجية ۰03 إلا أن 52 تجعل 
زوائد بداية الكلمة في متوالية واحدفه مثال ذلك تجزئة كلمة ”وسينتهي“ لتصبح ” وس+ 
ینتهی Decliticizing the conjunction wa © (WA) iz."‏ تعنی بتجزئة 
عر العطف ”الواو“ وهمزة الاستفهام وتتشابه مع منهجية DI‏ إلا أن الأخيرة 
ENNIO‏ 

(Arabic TreeBank) ATB و‎ (Arabic Treebank old) ATB old Gi 
فتعنیان بتجزئة (حروف العطف» وحروف الجر اللتصقة بالکلمة وهمزة الاستفهام»‎ 
تزید عنها زائدة السین التسويفية.‎ ATB والض‌اتر) إلا أن‎ 

ونخلص إلى أن هناك Ul‏ بين منهجي 51 / 23 و 52 وكذلك بين 22 و ATB‏ 
في تجزئة الزوائد بنوعيهاء ويتدرّج الاتفاق إلى نوع من الاختلاف بين DI‏ و «WA.‏ إذ 
يتمثل نمط الاختلاف بينهم باقتصار WA‏ على الفاء دون الواو في حروف العطف؛ 
وكذلك يق ATB old‏ و A78‏ حیث شم ۸ بتجزئة السین التسويفية. 


وطبيعة ما نصبو إليه - وهو التحلیل النحوي للجملة - يجعلنا نقف آمام الوحدات 
النحوية (الزائدة بنوعیها) باعتبارها rate‏ | مستقلا للتحلیل النحوي ذا علاقات نحوية 
نظمية بغیرها. وقد انتهجت الدراسة نهج البنك الشجري العربي من جامعة بنسلفانیا في 
تجزئة الزوائد» والتي تمثلت في (أداة التعریف-همزة الاستفهام - حروف ابر حروف 
العطف - الضمائر)» ESI‏ الدراسة لم تتطرق لفصل أداة التعریف؛ نظرّا لکونها وحدة 
لسیت دالة على وظيفة نحوية في بنية احملة. 

وني ضوء النهج القترح للتجزئة یمکن أن تصل الوحدات الفرعية الممكنة في 
الفعل إلى ثلاث وحدات فرعية (مثال ذلك: وسنقوها)» كا في الشکل رقم ۱۲: 


(1) Badr, I. & Zbib, R. & Glass, J. (2008). Segmentation for English-to- Arabic Statistical 
Machine Translation. In Proceedings of ACL. P.154. 


(2) Olive, J. & Christianson, C. & McCary, J. (2011). Ibid.P.81. 


(3) Maamouri, M. & Bies, A. & Buckwalter, T. & Mekki, W. (2004). The Penn Arabic 
Treebank: Building a Large-Scale Annotated Arabic Corpus. 
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الشکل: ۱۲ الوحدات الفرعية الممكنة للفعل. 
وکذلك یمکن أن تصل الوحدات الفرعية الممكنة في الاسم إلى أربع وحدات فرعية 
(مثال ذلك: وبم‌سوژولیتهم) كما في الشکل رقم MY‏ 


الشکل:۱۳ الوحدات الفرعية الممكنة للاسم. 


۳ التوحید المجائى Orthographic Normalization‏ 
تتمیز الكتابة العربية Bi‏ سياقية شديدة لکوا تمتاز بصفة التشبيك. إذ یتخیر 
شکل ارف الواحد تبعا للحرف السابق له أو اللاحق له أو كليهماء وهذا ما یتتطلب 

003, اش‎ ded sss 
وتفقد بعض الكلمات شکلا من حروفها حال انضیامها إلى مورفیم آخر أو تجزتتها‎ 
إلى التوحید الهجائي‎ Glo من ذاك الورفیم. ولذا يلجأ الباحثون في معالحة اللغة الطبيعية‎ 
بإرجاع تلك الكلمات إلى شكلها الصحيح بعد التجزئة» بهدف الحد من الضوضاء‎ 


O)‏ علي (نبيل): اللغة العربية والحاسوب» ص٤‏ ۲۰. (بتصرّف). 
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وتار البيانات ف التصوضی 9۶ 

وتتمثل أناطها فيا يلٍ: 

-١‏ حرف الجر الملتصق بأل التعريف في ” للعمل" يتم تجزتتها إلى ” ل+لعمل“ 
وبعد التوحيد امجائي تصبح ” ل+العمل". 

۲- حالات الهمزة التطرفة اللتصق بها ضمي رحسب موقعها في الاعراب مثل“ 
سیاژه" eee‏ "سائه" يتم تجزتتها إلى "سیاژ+ه "سیاء+ه" ue tele‏ وبعد 
التوحید ال حجائي تصبح " سماء +ه“ . 

۳- الالف القصورة اللتصقة بالضمير في ” مصطفاهم " يتم تجزتتها إلى ” 
مصطفا+هم“ وبعد التو حيد الهجائي تصبح ” مصطفى+هم“. 

-٤‏ التاء الربوطة اللتصقة بضمير في ” مدرستنا" يتم تجزتتها إلى ” مدرست+نا* 
وبعد التوحيد الحجائي تصبح ” مدرسة+نا". 

وقد استعانت الدراسة بالية © MADA*TOKAN‏ لتجزئة الوحدات الفرعية 
في نصوص الدونة اللغوية - عينة الدراسة - التي تم تطویرها من قبل فریق معاحة 
اللغات الطبيعية بمرکز آنظمة التعلم الحاسوبي بجامعة کولومبیا CCLS‏ وقد حزرت 
هذه الا لية بلغة بيرل البرمجية Perl‏ | تدعم بيئة التشغیل یونکس فحسب. ویوضح 
الشکل رقم ١5‏ صورة لواجهة آسطر الاوامرآو طرفية لینکس آثناء تنفيذ هذه الاداة 


(1) El Koly, A. & Habash, N. (2010). Techniques for Arabic Morphological Detokenization 
and Orthographic Denormalization. In Proceeding of LREC Workshop on Semitic 
Languages.P.45-46. And Habash , N. (2010). Ibid.P.21. 


(۲) شرع مركز آنظمة التعلم الحاسوبي بجامعة کولومبیا عام 0١٠٠م‏ - بقيادة العلَّمَئْنِ نزار حبش وأون رامبو Owen‏ 
Rambow‏ - في بناء نظام متعدد الهام ( التحلیل الصرفي» والتشکیل الآلي» وتجزئة النتصوص. وفك اللبس التصريفي» 
وتعیین الأقسام الكلامية» والتجذیع» والتفریع) بحيث یکون متاح للأغراض البحثيق وقد حقق نتائج لا بأس بها على 
مستوى التشكيل الآلي. ثم ظهر في ثوب جديد عام ۰۲۰۱۵ حيث أدمج في نظام AMIRA‏ لأدوات معالجة النص العربي 
التابع لجامعة كولومبيا آیضا؛ ليظهر في إصدار جديد باسم MADAMIRA‏ محرّرًا بلغة ا جافا البرمجية بدلا من لغة بيرل. 
وقد دعم هذا الإصدار الجديد العربية الفصحى والعامية المصرية. ينظر: 
MADAMIRA. (2015). http://nlp.ldeo.columbia.edu/madamira‏ 

(Y)‏ لغة برل Perl‏ هي لغة برمجية» قد تم تطویرها من قبل لاري وول ele‏ ۰۱۹۸۷ بهدف idles‏ النصوص في نظام 
یونکس Unix‏ التي كان من الصعب — حينها - معالجتها بالوسائل الستعملة. ینظر: 

Wikipedia The Free Encyclopedia. (2015). https://goo.gl/Ektxqk 
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40600000-0 مف 


الشکل:؟۱ طرفية واجهة آسطر الأوامر«لینکس» أسطر معالجحة الأداة MADA*TOKAN‏ للملف V gal‏ 


٠‏ دازق الدراما فى الفتمبان التاريكية 
سهان و نامر ٠‏ اغفا؛ الذات و slasi‏ التاريع 


yala‏ عام 
. لحن المململ ابقرلة ل نامر 

الفالعة عن ها ؛ تحدد ب فكل قاط الق الترقع شكمية. كان ل ها وجرد تاربكم ؛ حبذ ان الععلونان معربة jiad ulus‏ مببل العلل ؛ المكلف ب لعب دور عن 
i‏ قد عامرة ها ب ب Ju‏ و عابنت ها « ان التاريكبة الدعامرة . ب معلم ان + ان نعبة لبر قلبلة من تزداد المعربة ان كانن القضبة ؛ تلت ل الطبة 


ن » قبر ان ue‏ اخر ل الحكم على الجهور ؛ من مدي قدرة ٠‏ على تتليد الفضبة ؛ الني عرفرا فى الحكم على جردا اداء ١‏ ل القكمية ؛ pua‏ لدم م فالبية 


Gaia‏ و الدور 


و العبناريو » v‏ في Uo‏ الوجود التاريكي الشقمية في هذا الكبان المطروح في الروابة ؛ او + مبدئيا من الفروري النمبيز ٠‏ بين pela‏ الشخمية و الدور 
+ ب التموران الذهئبة عن تلك الشخمبة » يلاء ١‏ ل الذرر . هذا الفهم في حالة القصية العامة و الشاهد ان طربئة فهم العمل ل اللكمبة ۰ في ارل 


¢ ۰ ما لم نره من ها من قبل ۰ اي 


ن نري اللغمبة الناريخبة ٠‏ و مطابقة العرلي من ها . لكن لمربحة ر المعروق ان جردة الادا؛ لدى شربحة » ناتم في ali‏ 


جم المابفة ؛ لدم اربع ٠‏ من اكثر المعالجان تقديم لخمبان عامرة درامبا » دمرا نا jid‏ ل حفرر و بعدا عن ela!‏ العلري المكرور «Jia‏ السماعب ل 


اسهان 
deja‏ ان الدراما ننس ها ۰ كانت الى هد iUas! Cy! yaf‏ في s Jalan!‏ الذي Jo‏ امم ما۰ gto‏ على ارلا : الدور الذي لعبت ؛ ia‏ فواخرجي » من Gua‏ 
و ند jp As‏ ها فنارة الرقبة في الاكنشاف بعد « لك ها في Lai‏ فلي بد مواق ٠‏ آنث ناج فا ل ف ب الرفم من ان اسهان ١‏ في بداب الفململ في اسهان من 
ب فا و بشاعة فا ٠ Gali‏ من اول » ما يلبق ب نهر uas!‏ ذان ها في ذررة فا . ف في uut!‏ لقد تقدمث الشكمبة و نظررن ب ملامة على بد lul‏ . و فو 
ببة فرية ارم » Lj‏ » ف اقترب الي هة بعيد القرم : احكم اذوار ifl qo ٠‏ . لقد فرر الع على في لقع المململ بقدم الممثل aol a‏ شاكر في دور فزيد 
ناول ان بكرن dub‏ القل « لكن ناك oj: ١‏ من المبالفة ب طبيعة ٠‏ ۰ و من las Ua‏ الاحمام ل من هنا ؛ لي الفالب ؛ ما تیا ao!‏ على املوب فربد ؛ الذي با 

لامر 
ید النامر » ننا ارل قپرر ١‏ ؛ كلامة ها نام فلا مكثلنا نداما عن ما فعلن ؛ مرال . فى هو بعل لي Jalas‏ نامر ينام مجدي كامل » دور Jus‏ مبدالتامر. J‏ 


الشکل:۱۵ خرجات برنامج MADA-*TOKAN‏ 


: ابط‎ JE یمکن تحمیلها من خلال هذا‎ )١( 
MADA-TOKAN. (2015). http://wwwl.cs.columbia.edu/-rambow/software-downloads/ 
MADA Distribution.html 
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يظهر في الشاشة الأولى طرفية واجهة أسطر الاوامر لینکس" أسطر معالجحة الأداة 
للملف النصى الذي يمر بمرحلتين متتاليتين لتجزتته» المرحلة الأولي التحليل الصرفي 
Morphological analysis‏ باعتباره المسؤول عن تحديد المعطيات الأساسية حول أجزاء 
الكلمة» ثم مرحلة التجزئة Running Token‏ التي تنطلق من معطیات آجزاء الكلمة لا سيا 
اللواصق والزوائد. آما الشاشة الثانية فتظهر اللف النصی بعد تجزئته للوحدات الفرعية. 

وقد آمکن تعدیل نسبة اخطاًالناتجة عن ISI‏ - بالعابحة اليدوية ی نصوص الدونة 
اللغوية - والتي تركزت بشکل كبير على الحالات التي يشوبها اللبس مثل الواو التي تأي 
في أول الکلمة؛ لکنها جزء من جذع الكلمة ” ودعت“ وكذلك الباء في كلمة ”بسنت“ 


وكلمة ” بطّاقة“» وکذلك 5 في كلمة ” كفر“ el y‏ في كلمة " كره“ وغيرها. 


f‏ . نماذج لتجزئة الوحدات اللغوية في المدونة اللغوية عينة الدراسة 


الجملة١‏ وكان الشيّخ جاب الله قد أخرج عبر رفاقه من حركة ” النضة ”. 
التجزتة ١‏ و+كان الشيّخ جاب- الله قد أخرج عبر رفاق+ه من حركة ” النهضة ”. 


ورفضت السلطات السماح لقيادات وعناصر من " جبهة الإنقاذ الإسلامية ” 
بالترشح في الانتخابات على قوائم أحزاب صغيرة. 
و+رفضت السلطات ce!‏ ل+قيادات و+عناصر من ” جبهة الإنقاذ الإسلامية ” 
ب+الترشح في الانتخابات على قوائم أحزاب صغيرة. 

الملة۳ وهي شركات محدودة التعامل تم شطبها لأسباب تتعلق بنقص شروط القيد. 
التجزیة۳ | و+هي شرکات محدودة التعامل تم شطب+ها ل+آسباب تتعلق ب+نقص شروط القید. 
الجملةة أهي باللایین؟ 
التجزئة٤‏ آ+هی ب+اللایین؟ 
وذكرت صحيفة "ذا ديلي تلیجراف" البريطانية يوم ۲۱ - ۱- ۲۰۰۸ أن المملكة 
"تعتزم بنهاية العام ۰۸ ۰ رفع الحظر الفروض على قيادة النساء للسيارات. 
و+ذكرت صحيفة "ذا- ديلي- تليجراف“ البريطانية يوم ۲٠٠۸-١٠-۲١‏ أن المملكة 
”تعتزم ب+نهاية العام ۰۲۰۰۸ رفع الحظر الفروض على قيادة النساء ل+السيارات. 


الجدول:” أمثلة على التحزئة من المدونة اللغوية عينة الدراسة. 


a 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


توحید علامات الترقيم 


توحيد الارقام 


الشكل ٠١:‏ خريطة تدفق لمعالجة نصوص الدونة اللغوية 


Eu 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


o‏ . التحليل الإحصائى لوحدات Tokens‏ المدونة اللغوية 

”تتسم اللغة بخاصية الانتظام الإحصائي» حيث تظهر أي عينة أمينة في تمثيلها 
لواقع الاستخدام اللغوي استقرارًا إحصائيا من حيث معدلات تواتر الوحدات 
اللغوية الختلفة "۱ سواء أكانت كلمات أو وحدات أو جمل. 

وبعد أن استقرت المدونة اللغوية في صورتها الأخيرة أي بعد عملية تجزئة النصوص» 
یمکننا إحصاء وحدات مادة المدونة اللغوية با يساعد على معرفة مدى التناسق بين 
محالات المدونة اللغوية الختلفة. ويعرض الجدول رقم V‏ بيانات أو إحصاءات وحدات 
المادة اللغوية عينة الدراسة وفق التصنيف المجالى: 

بيانات وحدات المدونة اللغوية”" -عينة الدراسة- وفق التصنيف المجالى. 


44.9299 | 2480 | ۸۵ 59465 47.8% 50560 السياسة‎ | ١ 
11.4596 632 10.09% 11882 10.96% 11597 الاقتصاد‎ | ۲ 
11.5096 635 9.27% 10920 | 10.73% 11347 الفنون‎ | ۳ 
11.7496 648 10.82% 12746 10.54% 11147 £e 4 
10.72% 592 9.94% 11705 10.67% 11290 العلوم‎ ۵ 
9.67% 534 9.40% 11067 9.30% 9840 الرياضة‎ | 5 


الجموع 105781 | 100.00% | 117785 | 100.00% | 5521 | 100.00% 


امحدول:۷ إحصائيات وحدات الدونة اللغوية 


.۳۱۷ علي (نبیل)» حجازي (نادیة): الفجوة ال رقمیف رژية عربية لجتمع العرفة» ص‎ )١( 

(۲) الکلمة هي البناء اللغوي التکامل في بنية الجملة أي الصورة الأولى لشکل الفردات في الدونة اللغوية» آما الوحدة فهي 
أصغر وحدة نحوية يمكن أن تكون كلمة أو جزءًا من كلمة أو تعبيرا اصطلاحيا أي الصورة الثانية لشکل الفردة بعد التجزئة. 
وقد قمت بعمل إحصاء لشكل المدونة اللغوية قبل التجزئة S‏ ورد في جدول:۱ وكذلك بعد التجزئة كا في جدول:۷. 


ات 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقيا 
أو تداولها تجاريا 


يلاحظ أن أنصبة التوزيع النسبي لوحدات نصوص الدونة اللغوية (الرئيسية 
والفرعية)» تميل إلى الثبات أو الاستقرار في نصوص مجالات المدونة اللغوية» حيث 


إلى الانتظام عبر مجاللات المدونة المختلفة من الناحية الإحصائية. 


Exi 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الفصل الثانى 


العنونة بالأقسام الكلامية 


مقدمة: 

لا كان التحليل النحوي / التركيبي يتطلب تعيين الأقسام الكلامية لأجزاء الجملة 
باعتبارها مدخلا ابتدائيًا لتحديد العلاقات التركيبية الناشئة فيها بينهاء فقد جاء هذا 
الفصل معنونًا ب (العنونة بالأقسام الكلامية) تتناول الدراسة فيه توضيح تقسيم 
الكلام وآهمیته. وكذلك الحاجة إليه» ثم مفهوم العنونة بالأقسام الكلامية» وأهميتها في 
تطبيقات المعالجة الآلية للغة الطبيعية بشكل cele‏ ثم تعرض الفئات الكلامية المختلفة 
للغة العربية المستخدمة في العديد من التطبيقات» وأخيرًا يعرض الفصل ناذج من 
عنونة المدونة اللغوية بالعنونة الكلامية. وقد جاء هذا الفصل في ثلاثة مباحث على 
النحو التالي: 

۱- المبحث الأول: تقسيم الكلام وأهميته. 

- ما الحاجة لتقسيم الكلام؟ 

۲- المبحث الثاني: العنونة بالأقسام الكلامية. 

- فئة خوجة الكلامية. 

- فئة باكولتر الكلامية. 

- فئة بييز الكلامية. 


zx 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


- فئة بادت الكلامية. 

- فئة آر دي آي الكلامية 

— الفئة الكلامية القلصة الوسعة. 

- فئة القريني الکلامية. 

a -‏ کاتب الكلامية. 

- فتة كاليك الكلامية. 

- الفئة الكلامية للنص القرآني. 

- فئة سلمة الكلامية. 

۳- المبحث الثالث: عنونة المدونة اللغوية - عينة الدراسة - بالأقسام الكلامية. 


ی 


هذه ا لطبعة 


إهداء من المركز 
ولایسمح بنشرها ورقياً 
أو تداولها تجارياً 
الميحث الاول 
تقسيم الكلام وآهمیته 


١‏ - تقسيم الكلام وأهميته 


أفضى تفكير النحاة العرب في النّظر للکلام وجاریه XE ecl‏ إلى E‏ الكلاه”' يأتلف 
من ألفاظ متنوعة متباينة في الخصائص والعانی والوظاتف" تربطها علاقات سياقية 
منطقية أو يتخلّلها بعض BUYI‏ لاصطناع تلك العلاقةء وأنْ الفردة هي الوحدة 
القاعدية التي تبنى عليها العلاقات التركيبية» فكان استقرارهم في اللّغة على تمييز 
مكوناتها ووحداتها في أنظمة متكاملة؛ لتحرّي معطيات اللّغة ونظمها. 

ولا كان غرضهم من الاستقراء والوصف تعليميًا فحسب» فقد آولوا Gal‏ 
(۱) يلاحظ «أن النّحاة العرب قد استعملوا الكلام بمعنی الكلمات أحياناء فسمّوا تقسيم الكلمات إلى اسم وفعل وحرف 
تقسيًا للكلام)» QUU‏ مناهج البحث اللغويء مكتبة الأنجلو المصرية» ام SM‏ 
CO‏ يقول ابن السّراج في هذا السياق «والذي يأتلف منه الكلام الثلاثة» الاسم والفعل واحرف. فالاسم قد يأتلف مع 
الاسم نحو قولك : «الله إهنا» ويأتلف الاسم والفعل نحو: قام عمروء ولا يأتلف الفعل مع الفعل» والحرف لا يأتلف 
مع حرف فقد بان فروق ما بينهما» ابن السراج (أبي بكر محمد بن سهل): الأصول في النحوء تحقيق د.عبد الحسين الفتلي» 
مؤسسة الرسالة» eeN IAY Ob‏ الجزء الأول» ص EY‏ ويذكر أيضا عبد القاهر الجرجاني في مدخله لدلائل الإعجاز أن 
«الكلام ثلاث: اسم» وفعل؛ وحرف. وللتعليق فيا بينهها طرق معلومة؛ وهو لا يعدو ثلاثة أقسام: تعلق اسم باسم» 


وتعلق اسم بفعل» وتعلق حرف ee‏ ثم شرع في ذكر حالات التعلق بالاسم والفعل والحرف. ينظر: احرجاني (عبد 
القاهر): دلائل cose YI‏ مطبعة الدني بالقاهرق «Y‏ ص ۰۸-6 


Eze 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


as jac‏ والتّصنيف ull‏ يتكشفان Suo‏ التّتابعي في aad] JE‏ ثم كان تقسیم 
الكلم Part-Of-Speech (POS)‏ بمثابة المعطيات الأوليّة للتحلیل والوصف. 

أجمع الحا العرب القدماء على أن الكلام ينقسم إلى ثلاثة أقسام”" : اسم - فعل 
-حرفء وتنوعت تعريفات تلك الأقسام حسب المقاييس التي استندوا إليها كالمعنى 
والشكل G pal‏ والتحوي والاعراب والعمل النحوي» فيعرّف ابن هشام والسيوطي 
وغيرهم من العلیاء «الاسم Velo‏ كلمة تدل على معنى في نفسها ولا تقترن بزمان» وإذا 
اقترنت ففعل» أو في غيرها بأن احتاجت في إفادة معناها إلى اسم أو فعل أو جملة 
فحرف). ps‏ يعرّف ابن - جني «الاسم ما حسن فيه حرف من حروف الجر أو كان 
عبارة عن الشخص. .. والفعل ما حَسَنَ م فيه قد أو كان أمرّاء والحرف مالم تحسن فيه 
علامات الأسماء ولا علامات الأفعال» Bis‏ جاء لمعنى في غيره نحو هل وبل وقد).”) 
ويتضح من خلال هَدَيْنِ ار أن التحاة العرب اعتمدوا في تقسيمهم على المعنى 
ی وج ا UNAM‏ 
Scd d i‏ 
التقليدي الجملة الخبريّة باعتبارها ساس البحث اللّغويٌ» ومن ثمَّ تحدّد أقسام الکلام 
حسب وظيفتها في هذه الجملة فقط . ) 

ویخرج بعض اللخرين الحاصرین عن هذا الاطار لتقسيمي؛ معتمدین عل اليج 
التوازي ين الشكل والعى؛ i Lad‏ تقسيم آدق من تقسیم النّحاة القدماء فيتجة 


(۱) يعد سيبويه أول من أشار إلى التقسيم الثلائي في العربية» إذ يقول في كتابه «فالکلم: اسم فعل» حرف جاء بمعنى 
ليس باسم ولافعل». سيبويه ( آبو بشر عمرو بن عثمان بن قنبر): الکتاب» تحقيق عبد السلام محمد هارون» مكتبة الخانجي 
بالقاهرة» ee Y AAA‏ الجزء الأول» ص ۰۱۲ 

.۳ ص‎ «AMI الجزء‎ e YA Y الرسالة»‎ 

(۳) ابن جني( آبو الفتح عثمان): اللمع في العربية» تحقيق د.سمیر آبو مغلي» دار مجدلاوي للنشرء e AAA‏ ص ۰۱۲-۱5۵ 


)£( الراجحی (عبده): النحو العربي والدرس الحديث —- à‏ النهج». دار النهضة العربية للطباعة والنشی ۹۷۹ ام 
ص٦٤-۷٤.‏ 
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الذکتور إبراهيم أنيس إلى تقسيم رباعيٌّ(الاسم - الفعل -الحرف -الأداة)» معتمدًا 
e‏ العنی والشيعة ووظيفة Ja‏ الکلام فى تقسیمه للکلام؛نُواجهة ae‏ التطقي 
الذي غلب على og ge‏ دراساتهم S als eI‏ ثم سار على نبجه الدکتور 
مهدي المخزوميء إلا أنه أبدل الكنايات بالحرف؛ ليصبح تقسيمه (الاسم - الفعل - 
الكنايات والإشارات” -الأداة). 

وينحو الدكتور تمام حسان نحو تقسيم جديدٍ لأقسام الكلام؛ ليصل إلى سبعة أقسام 
Easy‏ (الاسم -الصفة -الفعل الضمير الخالفة -الظرف - الأداة) معتمدًا غل 
أسس فنظرركة فى تقسیمه من حیث البنی ( آي من حیث الصورة الاعرابية آوالرتبة أو 
الصيغة أو الجدول أو الالصاق أو التضام أو الرَّسم الاملائی )» والعنی (أي من حيث 
التسمية أو الحدث أو الزمن أو التعليق أو العنی الجملي). ثم قشم كل قسم Gu‏ 
أقسامًا فرعيّة يوضحها الجدول رقم ۸: © 


(۱) آنیس(براهیم): من آسرار اللغة» مكتبة الأنجلو الصرية ط1 ۱۹۷۸م ص .۲۹٤-۲۸۲‏ 
(Y)‏ يقصد بها الضمائر التصلة والتفصلة وأسماء الإشاراة والموصولات وأدوات الشرط والاستفهام. 
(Y)‏ حسان(تمام): اللغة العربية معناها ومبناها؛ دار الثقافة» 44£ ee‏ ص E! ٠‏ 


ec 
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الصفة 


الفعل 


الأقسام الفرعية 


اسم الحدث 


tæ 


T 


ST 
صفة الفاعل‎ 
صفة الفعول‎ 
صفة البالغة‎ 
الصفة الشبهة‎ 
صفة التفضیل‎ 
فعل ماض‎ 
ا‎ 
ENT 


=y 


الصدر 
اسم المرة 


اسم الميئة 


اسم الزمان 
اسم الکان 


JY اسم‎ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الأقسام الفرعية 


حضور خطاب 


الإخالة (اسم الفعل) 


الخالفة 
c‏ والذم 

الزمان 
الظرف 

الکان 

أصلية 
الأداة 

محولة 


جدول: ۸ أقسام الكلام العربي-د.تمام حسان 


يلاحظ في هذه التّقسيمات أنَّ الفردة قد تكون a‏ کلام واحدًا مثل الاسم أو 
الصّفة أو الفعل أو الضمیر.... و قد تكون مكونة من قسمَيْن oS‏ أو أكثر مثل 
کلمة «عملهم» (اسم وضمیر) روف (آداة وضمیر)» ا أن الس الکلامی الواحد 
قد یکون مكونًا من مورفیم واحدٍ مثل: قد - هل - في - لکن»...وقد یکون مکونا من 
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أكثر من مورفيم مثل الأسماء والأفعال التي تتركّب من مورفیمات عديدة. 

ee de» ,‏ من هذه الحاولات التي د bles‏ لارساء التجدید coo à‏ 
اللوي ا لحديث» واعادة ÉN‏ في المسلمات التي يُنيّت عليها E I‏ النّحويّة الوصفية 
فا تقف قاصرة على eli‏ بوصف الظّاهرة ei xl‏ لاعتمادها على التعليل والتأويل 
دون JEDE‏ في إطار الظاهرة اللغوية - أعني بالظاهرة هنا النّصّ الکتوب لا النطوق- 
والتاظر في الواة قع e AUI‏ سوف يجد Bl‏ هناك كلماتٍ ذات سلوكٍ متباين» إدراجها تحت 
أي قسم كلامي من التّقسيمات السّابقة سيفقدها بعصا من خصائصها وصفاتها مثل 
الکلیات ا و العلامات وغبرها. 


dq npe) 

لعل J5l‏ مطالب هم المنظومة اللغوية وتحليلها أن ÍA‏ عناصرها el AI‏ إذ 
کف معني الس إلا إذا Se ESA e ES‏ نکن الفونيم هو 
الوحدة الأساسيّة لبناء الوت الكلاميٌ» والمورفيم هو الوحدة الأساسيّة لتكوين المباني 
sei a‏ التاجیم أو السّنتيم هو الوحدة القاعدِيّة التي نی عليها لعلاقات ال ES‏ 
في الجملة باعتباره بناءً لغویا متماسکا - سواء OLT‏ مورفيًا أو قسًا كلاميًا - مساهمًا في 
ديك الوطيقة X ecl‏ والعنی لو ليتتحي بذلك E f‏ أذ Las‏ ار 
والکشف عن آسرارها وأساليبهاء أو لعالتها حاسوییّا. 

وقد ذکر الذکتور تام حسان أن هناك أسبابًا لجعل تقسیم الکلم V‏ ضرو ریا للتعبير 
عن gil‏ التحوية آوجزها فا بلي: ۲۷ 

١‏ -يتوقف جزء من العنی النّحوِيٌ على البنية الصَّرفيّة؛ إذ يتطلّب الوقع النحوي 
cda ss QU‏ فالفاعل والفعول يتوقفان على کون البنية eel‏ ویتوقّف الفعول المطلق 
على بنية الصدر من مادّة الفعل» ER‏ بتوقف الفعول لاجله عل بثية الصدر من غير 
مادّة الفعل» وكذلك تتطلّب کل الفراغات الوظيفيّة شواغل تشغلهاه ومن ثم كانت 
pau up dc‏ تحبر عن تلك الفراغات الوظيفية. 

۲-تضح العاني الصرفيّة الحامّة بتقسيم الکلم» منها المسمّىء والوصوف با حدثه 
واجتماع الرّمن والحدث...إلخ. 


(۱) ینظر: شمس الدین(جلال): الأنماط الشكلية لکلام العرب. الجزء الأول» Noe‏ 
(۲) الساقي (مصطفی): آقسام الکلام العربي من حيث الشکل والوظيفة» مکتبة الخانجي بالقاهرة ee \ AVV‏ ص ۰۱۸-۱ 
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۳-الفصل بين أقسام الکلممجعل ال ني مأمَن من oe‏ فهم بعض الأقسام التي تنقل 
في الاستعمال إلى آفسام «sl‏ کنقل الفعل والوصف إلى العلوية والاسم إلى الظ 5 e‏ 

4 -بیان العاني الوظيفيّة للمبنی الواحدء ویتضح ذلك في کثرة صیغ الاسم 
لالش ال وا 

ه-من خلال تة تقسيم الكلم EKS‏ تحديد العرّب والمبنى» ومن تم الانتفاع بقرينة 
الإعراب في الکشف عن العنی النحوي. 

1 -تحديد المباني التي مد القرائن RS AI Ca‏ في dat‏ الي مثل قرينة الرّبط 
التي تتطلب omne‏ هما الضمیر والرجع» وکذلك الرّبط بالطابقة یتطلب مبنین 
متطابقَيْنٍ أو آکشس...الخ ويتأنَى ذلك في ضوء تقسیم الگلم. 


۲. العنونة بالأقسام الكلامية POS Tagging‏ 

هي عمليّة تعيين الأقسام الكلاميّة وما تحمله من سات صرف-نحويّة لكل كلمة 
منفردة بمعزل من سياقها الاعراي في النص» وذلك بإلحاق كل مفردة برمز Tag‏ أو عدة 
رموز تعبر عن القسم الكلامي وما يحتويه من مورفيمات eg ol‏ 9 

وتقتضي جل أنظمة تطبيقات AUT bae‏ الطبيعيّة واسترجاع المعلومات استخلاصٌ 
السّمات النحويّة البداتيّة التي تحملها مفردات النصوص؛ لتعينها على تعيين القوالب 
PARET‏ ند |3 تعتبر هذه السات هي حجر "m‏ في منحی التحليل NAT‏ 
PU‏ يتطلّب تحلیل اللصوص إلى عناصرها الأوَليّة باعتبارها أجزاءً AKU‏ وذلك 
لسهولة التصنيف والتنظيم والترتیب» والبحث عن القوالب والشراف Ar est‏ 

ذل العنونة نة بالأقسام الكلاميّة دلیلا أولا إلى معرفة املامح اللسانية الأساسية 
للعدید من التطبيقات الحاسوبية الي تحرج lu‏ جات من ناحیة scalis us‏ 
من ناحية آخری؛ ومنها: 


(1) Van Halteren, H. (1999). Syntactic Wordclass Tagging. Springer-Science-* Business 
Media.B.V. University of Nijmegen. P.3. & Attia, M. (2004). Theory and Implementation Of 
a Large-Scale Arabic Phonetic Transcriptor, and Applications. PhD dissertation, Faculty of 
Engineering, Cairo University, P. 42. 

(2) Aliwy, A. (2013). Arabic Morphosyntactic Raw Text Part of Speech Tagging System. 
PhD dissertation Under the Supervision of Prof. dr hab. Jerzy Tyszkiewicz, Faculty of 
Mathematics, Informatics and Mechanics, University of Warsaw. P.7. 


(3) Van Halteren, H. (1999). Ibid. P.7. 
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Information Retrieval استر جاع العلومات‎ ٠ 

تزایدت العلومات بصورة متسارعة في ظل تنامي à Jl‏ المعلوماتيّة العارمة» 
وانتشار الشّبكة المعلوماتيّة التي تتعامل مع العدید من العارف مثل الکتب eol) sels‏ 
والتفرات والصحف oes M Ty‏ الله وغی‌ها من كرا العارف le see ME‏ 
أدّى إلى صعوبات Xe‏ في استخلاصها وتنقیتها من الخضم العلوماتي» فکان لزامًا على 
العلوماتبین مواجهة هذه التحدیات ببناء نظم للمعلومات قادرة على استخلاصها 
وتجميعهاء تنطلق من العطیات AUI‏ في تشخیص الکلیات المفتاحية؛ للکشف عن 
محتوى النص. 

pes‏ تلك المعطيات اللّْويّة في ارف على خصائص كلمات ال من حيث 
أجزاؤها الكلاميّة وسماتها oJ e ecl‏ الكلمات الفتاحية Key words‏ لهذا oai‏ الح 
یمکن من MSS‏ الكش عن مضمون ال وديا مواطن العلومات الماك ا o‏ 


Syntactic Parsing التحلیل النحو ي‎ e 
owi إذ هي من آهم‎ A ecl على العلاقات‎ asi الكلامية‎ Sai Ag 
معرفة الوظيفة النّحويّة الدّالة على الكلمة في‎ EKS حيث لا‎ (S nc lot الابتدائيّة‎ 
gU فعل».‎ » pu OSA auos Cs (فاعل» مفعول» مضاف إليه.‎ ail 
للجمل الذي ترسى دعائمه المركبات‎ G oci كما تدفع الأبس ال كي في عرض التميل‎ 
أساسيّة في الاستدلال على‎ T ک| سنعرض لاحقاء علاوة على أا‎ Phrases النحوية‎ 

التشکیل الا للكلمات من خلال خواصها الصَّرف - نحويّة. © 


Spelling and Grammar checking ي‎ x 3 Pe التدقیق‎ ۰ 
الأنياط ال الشّكليّة‎ de Ji Se الإملائيّة‎ eia ds dolci تطلّب‎ 


(1) Alqrainy, sh. (2008). A Morphological - Syntactical Analysis Approach For Arabic 
Textual Tagging. PhD dissertation, School of Computing Faculty of Computing Sciences and 
Engineering De Montfort University. P.18. 


(2) Attia, M. (2004).Ibid.P.42. 
(3) Attia, M. (2004).Ibid.P.48. 
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آن يدرك أن خالفة التّمط eos 3 2s A‏ این a‏ الجر» 
يعد من قبيل الخطأء وذلك من خلال معرفته ال اقا عیام الشكلّ للكلام» ۳ 
على الستوی الاملائي» إذا استطاع eU‏ أن يمير بين مواضع الفعل والاسم قطعًا 
سيكتشف الخطأء ثم يقدم ديك مقترحًا لکلمة «سعی» في عبارة «سعی العمرة)؛ 
لتصبح «سعي» بالياء لا بالالف المقصورة؛ لكونها Cel‏ هنا. 

Speech synthesis تخليق الكلام‎ « 

تستند معظم أنظمة تخلیق الکلام أو تحویل oai‏ المكتوب إلى المنطوق (TTS)‏ 
Text-to-Speech‏ في بنائها على آسالیب MES‏ الإحصائي JA‏ يتم بموجبها تکوین 
الكلمات من وحدات صوتيّة صغری سواء آکانت فونیمات أو دیفونات"" أو مقاطع 
صوتية أو مورفیمات صرفيّة حسب التهج RU el‏ والّذي یکون EU‏ - غالبا - 
عن مدى ثراء Richness‏ إحدى هذه الوحدات في المدوّنة RA‏ المستخدمة. 

ويتم هذا التوليد أو التخلیق بتحويل سلسة الٌروف المكتوبة إلى سلسلة من 

الفونييات» ثم اختيار الوحدات الصّوتيّة (دیفونات. أو ترايفونات» أو مقاطع صوتيّة» أو 
مورفيهات صرفيّة) من المدونة الصوتية بناءً على احتمالات الوحدات المتجاورة؛ لتركيبها 
على تلك الفونبيات الكتابيّة فيا UA‏ بالتولید P concatenative synthesis AE‏ 

وتتراوح دقة الأداء الصوتق eux c‏ حسب ملاءمة الوحدات الصوتيّة ونوعها 
E‏ الا ولتحقیق آداء del‏ من جودة الصّوت» يمكن استخدام القاطع 
2S RENAL‏ أو الورفیمات کعنصر صوق لتولید الکلمات G‏ فهي عناصر تحمل في VÉ‏ 
معطیات آکثر عن وضع الفونیم داخل الوحدات الصوتية. O‏ 

ثم gb‏ الاقسام AII‏ لتزيد الأمر وضوحًا وه حيث تعد الإشكالية في اختيار 
الورفیم الصوتي من بين العديد من صور المورفيهات الصوتية المختلفة الى تشملها 
RIA E‏ لیتلاءم مع سلسلة الفونیمات الكتابيّة» بين تحديد القسم الكلاميٌ — 
lud‏ - للکلیات المكوّنة من الوحدات الصّوتيّة وللكلمات التي سيتم التعرّف عليها 
صر ان شيعو coeli dato‏ الصّوتيّة في ÉU‏ لطبيعة ملاء‌مة alt a‏ ;^ 


(۱) الدیفون: هو النطقة الزمنية الواقعة بين نهاية الفونیم الأول وبداية الفونیم الثاني. 
Jurafsky.D, Martin.J. (2007). Ibid. P.316-326.‏ )2( 
Jurafsky.D, Martin.J. (2007). Ibid. P.275.‏ )3( 


. ٤٤٦ م» ص‎ AAA على (نبيل):اللغة العربية والحاسوب» تعریب»‎ CE) 
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Pas uL MES‏ الکله d‏ ل یی 


n 


«الترحمة الالية Machine Translation‏ 
تعد الترجمة ZI‏ بين اللّغات sl‏ إحدى الغایات ME‏ الي Ea‏ فیها 
معظم روافد LE‏ الل وا کیب Os ual‏ «وقد تحقق العلماء» Jj‏ کارب مريرة 
نم بعيدون عن بلوغ هذه DIUI‏ على e‏ ما حققته ISI AN‏ الإحصائية 
Statistical Machine Translation (SMT)‏ من نتائج Y‏ باس اء فان p‏ 
GU‏ لم يبلغ Ío‏ الكفاية في فهم ais‏ إلى الآن» على أمل في إقحام العلوم 
الإنسانية المعرفية تلك الإشكالية في ظل بزوغ مجتمع المعرفة؛ للكشف عن الحدس 

الذي يمتلكه الانسان وفطرته A SUI‏ 

وقد حظيت ZI im UE‏ الإحصائية مورا pleal‏ بالغ من E‏ العديد من 
المؤسّسات والشّركات ووزارات الدّفاع العالیّت نظرًا لدقة النتائج التي تحققها مقارنة 
بالترحمة الآلية المعتمدة على المنهج القاعدي Rule-based‏ . 

ويمكن استخدام المدوّنات Parallel Corpora (93,5 jl à XUI‏ الموصّفة 
بالأقسام الكلامية في بناء النهاذج الإحصائية؛ لزيادة دقة نظم الترجمة الآلية. ^ 


Lexicography صناعة العحات‎ o 
سا‎ 
d auri ي اللسانات الحاسو‎ (nde ab لین‎ de E جمع‎ We و قرص‎ 


Alqrainy, sh. (2008). Ibid. ۰‏ )1( 
() على (نبيل):اللغة العربية واحاسوب» ص ٠٤١‏ . 
(۲) الوسی (ناد): العربية نحو توصیف جدید في ضوء اللسانیات الحاسوبية» المؤسسة العربية للدراسات والنشر ط ۰۱ 
DREE‏ ص „O‏ 


oU SAUCE)‏ التوازية هي جموعة من نصوص لغة من اللغات وترجمات هذه النصوص في لغة آخری. ینظر: 
Lüdeling, A & KytÓ, M. (2008). Ibid. 275.‏ 
Alqrainy, sh. (2008). Ibid.P.18-19.‏ )5( 


.۲۵۲ الموسى (غاد): العربية نحو توصیف جدید في ضوء اللسانیات الحاسوبية» ص‎ O 
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ضوء تعدد أغراض الصناعة المعجمية التي تقة تقتضي العديد من المعلومات اللغوية وفق 
ما تحدده طبيعة العجم والغاية منه. 

وتعددت آشکال الصناعات المعحمة pen Je à‏ المدوّنات i zi‏ 
تعکس JE‏ |8 قع al (ga‏ الدروسة(؟ jt‏ معاجم الوضوعات والعلوم والفنون 
والاداب والعاجم à Sli‏ وشبکات الکلات. وغيرها من آشکال الصناعات 
الل التي T‏ في استشفاف معطياتها بتعيين الأقسام الكلاميّة لفرداتها. 


Sentiment Analysis تحليل الشاعر‎ e 
وتنامیها في ظل بزوع جتمع‎ Gre I La ell مع تعاظم استخدام شبکات‎ 
تفع موشرات قاس ال‎ d eS os مق تست مور اللومات اي بت‎ 
الاقتصاديّ والسياميّ في إطار تدخل تقنیات اللّغة لاقتصاد تلك العرفة المتمثلة في‎ 
انس العمر»‎ enn محتویات ملفات مستخدمي شبكات وال الاجت‌اعي مثل‎ 

المنطقة ASSI‏ الاهت‌امات. التدوینات. التعليقات» الاعجاب بالتّدوینات). O‏ 

ات الأغراض من اقتصاد تلك المعلومات بين معرفة ة معدلاات الاستهلاك» 
وتوقع أنماط الطلب واحتمالات الكسب والخسارة» واستهداف بعض اده 
واستطلاع «Sli‏ والاستدلال على این وغيرها من الأهداف الأخرى. ” 

وتنحو تطبیقات تحلیل الشاعر إلى تصنیف نصوص (تدوینات) مستخدمي شبکات 
93 2 الاجت‌اعي ما بين كونها | إيجابيّة positive‏ أو سلبيّة negative‏ أو محايدّة neutral‏ 
لقياس مدی بعض التوجهات EAI‏ سيّة أو الاقتصاديّة أو Sis Delea NT‏ ذلك 
cial‏ في ضوء الأدلّة اللّغوية التي تنطلق من الكلمات والعبارات المعبّرة عن تلك 
العراطف. وتقتضى آليات التصنيف Classfiers‏ استقراء تلك الأدلة من خلال dé‏ 
نواظم نصوص تلکم التدوینات بالسمات الصرف - نحوية. © ۱ 


(1) Lüdeling, A & KytÓ, M. (2008). Ibid. 6۰ 


(2) Sakaki, Sh & Miura, Y & Ma, X & Hattori, K & Ohkuma, T. (2014). Twitter User Gender 
Inference Using Combined Analysis of Text and Image Processing. In Proceedings of the 25th 
International Conference on Computational Linguistics. Dublin, Ireland. P.54. 

(3) Sakaki, Sh & Miura, Y & Ma, X & Hattori, K & Ohkuma, T. (2014). Ibid.P.54. 

(4) Cambria, E & Poria, S & Bisio, F & Bajpai, R & Chaturvedi, I. (2015). The CLSA Model: 
A Novel Framework for Concept-Level Sentiment Analysis. In Proceedings CICLing 2015, 
Egypt. Springer International Publishing Switzerland 2015. A. Gelbukh (Ed.). Part II, P.7. 

(5) Peng, B & Li, J & Chen, J & Han, X & Xu, R & Wong, K. (2015). Trending Sentiment- 
Topic Detection on Twitter. In Proceedings CICLing 2015, Egypt. Springer International 
Publishing Switzerland 2015. A. Gelbukh (Ed.). Part II, P.71. 
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«التعرف على كينونة الاسم Named Entity Recognation‏ 
يندرج هذا التّطبيق NER‏ تحت فرع استخلاص المعلومات Information‏ 
0 حيث یعنی باستخلاص الفئات الاسمية من التصوص مثل آساء 
ceste‏ أسماء الميئات والنظیات. الأسماء الدالة على الزمان الأسماء الدالة على المكان» 
آسیاء الأعداد....إلخ والتي يُنطلق منها - في| بعد - في بناء أنظمة إحالات الضمير 
anaphora resolution‏ لإحالة steal‏ إلى أسمائها في النص. © 
فالعنونة بالأقسام الكلاميّة بمثابة العمود الفقري للعديد من التطبيقات اللسانية 
التي تتقارب من تناظر الأداء الإنساني بها يتعلق بالملكة اللغوية» ويوضح الشكل رقم 
۷ موقم X lI‏ الكلاميّة في طبقات سلم معالجة اللّغة الطبيعيّة: 


الشکل: ۱۷ العنونة الكلامية في طبقات سلم معالحة اللغة الطبیعیة(۲) 


(1) Jurafsky.D & Martin.J. (2007). Ibid. P.832. 
(2) See: Attia, M. (2004).Ibid. P.34. 
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يلاحظ من خلال الشّكل السابق أن العَنْرّنة بالأقسام ASI‏ تتوسّط بين Jes‏ 
العجمي Lexical Analysis‏ و التحليل الحو ي Syntactic Analysis‏ في طبقات 
معا مة لت الطبيعيّة؛ ؛ لتکون مَذخلا للتّحلِيل النّحوِيٌ الذي يُناط به توفير العطیات 
za‏ للتّحليل Gi‏ الأعمق eil‏ الأتوماتي للنصوص وی فضلا عن كونها 
منطلقا أساسيًا لتطبيقات التحليل اللساني. 

. ولماكان المأمول من s‏ لمدؤنات اللّيّة بالأقسام الكلاوية ميه أن تكون مورذا لا ة 
al‏ الطبيعيةء كان لاب أن نحدّد e I‏ في t‏ منهجية الأقسام AE EASI‏ 
تُصنّف مفردات مادّة IG SA‏ اللغويّةء وذلك باستقراء الخصائص الصّرف -نحويّة التي 
تتناسب والهدف النشود. ثم تجريدها على هيئة عدد محدود من الرموز- تسمّی Tag‏ 
set‏ التي Zi‏ عن تلکم السّمات K a‏ وتتفاوت عدد السیات au‏ تہدف V adl‏ 

وبدأت تتبلور تلك الأقسام الكلامية مية للخة الإنجليزيّة cosi dude‏ لقان من 
القرن العشرين على هيئة فتات من السّمات الصَّرف- نحويّة تنظر JAU‏ باعتباره 
الظاهرة موضع الدراسةء فتصدرت SA c‏ بروان al‏ الإنجليزيّة تلك till‏ ليصل 
عدد AV Lees‏ سمة بینا تقل غدد سات بنك بتسلفانيا التحويٌ؛ لتصل إلى £0 سمةه 
وتتوسّطهما عدد السّمات الستخدمة في مشروع CLAWS‏ والتي بلغت ٩۱‏ سمة NIC‏ 

إن غنی اللّغة العربيّة صرفيًا دی إلى وجود العدید من الورفیمات التي يصعب 
العمل علیهاجیفاء فضلا عن أن كثيرًا من الباحثين في معا anb za‏ يفضّلون 
العمل على فئات السّمات XUI‏ & ة الأصغر حج؛ حتى يمكن التو بها Da‏ في ضوء 
استخدام آسالیب امل الصا .9 ۱ 

وقد تعدّدت منهجیات الأقسام الكلاميّة Ax‏ العربيّة التي تصتّف مفردات النص 
في ضوء وصف الواقع اللغوي منها 


(1) Sawalha, M. (2011). Open-source Resources and Standards for Arabic Word Structure 
Analysis: Fine Grained Morphological Analysis of Arabic Text Corpora. Submitted in 
accordance with the requirements for the degree of Doctor of Philosophy From The 
University of Leeds School of Computing.. P.96. 


(2) Sawalha, M. (2011). Ibid. P.96. 
(3) Habash , N. (2010). Ibid. P.79. 


c 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


۱-۲ فئة خو جة الكلامية (Khoja Tag Set)‏ 

تعتبر الباحثة شبرین UD‏ صاحبة آول محاولة جادة في تصميم XS‏ الأنواع 
iq dl ual POS Tagset SI‏ حيث قامت بوضع منهجية مغايرة للأجزاء 
الكلامة مي غير اني تسیر عليها لت الأوروبيةالأسياب قد ES‏ في ورقتها امون 
o xn‏ الأجزاء الكلاميّة مية ua‏ العری» منها: U É ai ai oj‏ طبيعة خاصّة 
o ad "T‏ از خر السّاميّة بيا المعايير الأوربيّة SUP‏ 97 


D 


cto PAGLES‏ خصيصًا 5 sco asi‏ هذه العاییر لا تقد بعض 
العلومات الصَّرف-نحويّة التي تتفق وحال العربيّة مثل البناء والإعراب» فانطلقث 
E E‏ العربي التقليدى (LS - Traditional grammar‏ يطلقون عليه الوصفيون- 
واستقراء الواقع او العاصر ؛ لتصل في تقسیمها إلى Ast‏ آقسام زگ i‏ (الاسم 

الفعل الأداة - أخرى علامة الترقيم)» وکل قسم من تلکم الأقسام يحتوي على 
تقسيمات (GS e à‏ بالشکل رقم ۰۱۸ 


(Y)‏ تعد الباحثة الدکتورة شبرین خوجة من رواد معالجحة اللغة العربية آلياء وقد نالت الدکتوراه في معالجة اللغة الطبيعية 
من جامعة لانکاستر عام ۰۰2۲۰۰۳ وتعمل حالیا في وظيفة آستاذ مشارك في قسم علوم الحاسب جامعة باسيفك 
JU Pacific‏ لایات التحدة الأمريكيةء ومن اهتماماتها العملية في جال اللغویات الحاسوبية: التجذیم» وقد طورت معنونا 
UT‏ للأقسام الكلامية للنص العربي APT‏ وکذلك صناعة الدونات اللغوية للغة العربية. وقد صممت فئة الأجزاء 
الكلامية بمساعدة اللغوي جيري نیولز Gerry Knowles‏ آستاذ اللغویات بجامعة لانکاستر. ینظر : 
Shereen Khoga. (2015). http://zeus.cs.pacificu.edu/shereen/index.html‏ 
(Y)‏ تقدم الجموعة الاستشارية الخبيرة في معاییر هندسة The Expert Advisory Group on Language àxUl‏ 
(Engineering Standards (EAGLES‏ البادی العامة التوجيهية لترمیز نصوص الدونات اللغوية. ینظر : 
http://www.ilc.cnr.it/EAGLES/browse.html EAGLES. (2015).‏ 
Khoja, Sh. (2001). APT: Arabic Part-of-speech Tagger. In Proceedings of the Student‏ )3( 
Workshop at the Second Meeting of the North American Chapter of the Association for‏ 
Computational Linguistics (NAACL2001), Carnegie Mellon University, Pittsburgh,‏ 


Pennsylvania. 


AX 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


Gender (i)‏ (الجتس): M‏ متکر - ۴ مؤتت - N‏ محايد 
Number(i)‏ (العدد): Sg‏ مقرد - Pl‏ جمع - Du‏ متتی 
Person(iii)‏ (التخص): ١‏ للمخاطب -۲ للمخاطبة- ۳ اللغائب 
Case(iv)‏ (الحالة): N‏ مرقوع - A‏ متصوب - G‏ مجرور 
Defmiteness (ivv)‏ (للتعريق): D‏ معرف - ]غير Eyes‏ 
شکل ۱۸: فئة خوجة الكلامية 

وبهذا يصل عدد السات المنفردة التى Gol‏ خوجة إلى ۵۱ سمة متضمّنة علامات 
الفصائل التّحويّة (التعريف د العدد - انس = احالة - الشخص)»:وعندما تتکامل 
فیا بینها تصل إلى ۱۷۷ سمة» تتوزع على الأقسام الرئيسيّة كالآتي: ۱۰۳ oV deal‏ 
فعلا» ٩‏ أدوات» ۷ أخرىء Y‏ علامة الترقيم. ۲۲ ویوضح الجدول رقم ٩‏ خالا à aJ‏ 
خوجة بالأقسام الكلاميّة لجملة «تنفيذًا لتوجیهات خادم الحرمين الشریفین». 


(1) Khoja, Sh. (2001). An Arabic Tagset for the Morphosyntactic Tagging of Arabic. In 
Proceedings of Corpus Linguistics, Lancaster University, Lancaster, UK, March. P.3. 


Ads 


هذه الطبعة 
إهداء من المركز 


ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


مورفيمات الأجزاء الكلامية 


NCSgMI as‏ اسم_عام_مفرد_مذکر_غیرمعرف 
لتوجیهات PPr'NCSgMI‏ آداة_جر_ اسم_عام_مفرد_مذکر_غیرمعرف 
خادم NCSgMI‏ اسم_عام_مفرد_مذکر_غیرمعرف 
NCDuMD TOU‏ اسم_عام_مثنی_مذکر_معرف 
الشریفین NCDuMD‏ اسم_عام_مثنی_مذکر_معرف 


الجدول:4 عنونة خوجة بالأقسام الكلامية - نموذج من مدونة خوجة" 


يلاحظ أن عدد السّمات يختلف في al‏ المجرَأً للرّوائد Clitics‏ - بنوعيها - عن 
غيره» إذ نجد في JULI‏ السابق - غبر مزا من ناحية الروائد are‏ عند الات 
إلى خمس سات تندرج جیعهم تحت القسم الكلاميّ الاسم N‏ أمّا في حالة التجزئة 
بالرُوائد فيزيد عدد السّهمات؛ OM‏ بعض الزوائد مثل الأدوات تعتبر قسرًا کلامیّ. كا 
یلاحظ أن هذه النهجية تفصل بين الأجزاء الكلامية في الكلمة بعلامة ( * ). 

وما يؤخد على هذه الفئة أن ال هدف منها لم يكن محددّاء وإن كانت غايتها أن تکون 
شاملة لتطبيقات معالجة اللغة الطبيعية» فهي لم تستوعب كل الخصائص الصرف- 
نحوية للغة العربية التي تعين على تمييز مفردات النص» مثل: عدم تمييز وضعية السوابق 
واللواحق في الكلمة» عدم تعيين رموز تدل على قطعية احتمال حالة النصب أو الجر 
للضمائر الملتصقة بالكلمات. 


(Buckwalter Tag Set) باكولتر الكلامية‎ i ۲-۲ 


م الأمريكي 7 تيم باک التر "^ Buckwalter‏ 0 بتطوير 23 جديدة للأنواع الكلامية لل 


Khoja, Sh. (2001). ۰‏ )1( 
(Y)‏ أستاذ اللغويات الحاسوبية بجامعة ماریلاند بالولایات التحدة الأمريكية» له العدید من الاسهامات في جال معالجة 
اللغات الطبيعية» منها على سبیل المثال لا ا لحصر: التحلیل الصرفي للغة العربیة» صناعة العجم العربي» النقل الكتابي. 


حورت 


إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 

العري؛ بهدف إدراجها في له الصّرقّ OBAMA‏ تنطلق في ظاهرها من ثانية أقسام Ra‏ 
وهي( الاسم - الفعل - الصفة - الظرف - الحرف - الضمير - الأداة -الأخرى) كا ورد 
في تطبيقه لتلك الفئة الكلاميّة» ويوضّح الشکل رقم ۱۹ مثالا من حرجات Outputs‏ المحلّل 
BAMA ($ A‏ - الذي اعتمد على فئة الأقسام الكلاميّة في تحديد سات أجزاء الكلمة- لجملة 
«تم إعداد الوثائق المتوفرة بكثرة حول أول رحلة طيران عثمانية فوق البلاد العربية». 


الشکل:۱۹ مخرجات محلل باكولتر (Pd mai‏ 


)١(‏ محلل باکولتر الصرفي للغة العربية Buckwalter Arabic Morphological Analyzer‏ « للاستزادة حول 
التفاصیل [ ینظر 3 

Buckwalter, T. (2004). Buckwalter Arabic Morphological Analyzer Version 1.0. Lin- 

gistic Data Consortium, University of Pennsylvania, 2004. LDC Catalog NO: LDC2004L02. 


(2) Sawalha, M. (2011). Ibid. P.101. 


uA us 


هذه الطبعة 
إهداء من المركز 


ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


يلاحظ أن المحلّل AI‏ يطرح جميع التّحليلات KII‏ للكلمة الواحدة ثم 
جع مر ابلك شجري العري يلا احا في بای الم - حسب مايؤول aJl‏ 
السیاق- بوضع علامة * dedil‏ ي ينسم الكلمة إلى أجزائها 
Ce‏ اس ار و ره 
الفعة الكلاميّة 

وقد اشتملت هذه الفئة الكلاميّة على ۷۰ سمة أساسيّة منفردة» وعندما تتحد هذه 
coL‏ الفرعيّة تصل إلى ۱۷۰ aus‏ مثال ذلك اتحاد السّیات الثلاث ( NSUFF‏ 
1-56 للدّلالة على لاحقة المفرد «sig‏ وکذلك۸00 (CASE DEF‏ 
للدّلالة على حالة Cal‏ ويعرض الجدول رقم ۱۰ هذه السیات: 


NOUN Noun اسم‎ VERB verb فعل‎ 
poen às PSEUDO  , Pseudo- شبه‎ 
NUM number > VERB verb الفعل‎ 
NOUN. Quantifier كمية او‎ PV Perfective الفعل‎ 
QUANT noun مقدار‎ verb التام‎ 
NI 
Deverbal int الفعل‎ 
NOUN VN تفت‎ PV. PASS Perfective e 
noun من‎ passive verb J s 
للمجهو الأفعال‎ 
NOUN. Proper | l ۱ 
PROP noun pu PVSUFF | ی‎ | ddl 
الصفة‎ «DO:«PGN " i الباشر‎ 
VU Subjectof | الفاعل‎ 
ADJ Adjective صفة‎ «SUBJ-cPGN Perfective | PEU 
i verb بالفعل‎ 


(1) Habash , N. (2010). Ibid. 80. 


—AÉf- 


هت 


اهداء 


١ه‏ الطبعة 


من المركز 


ولايسمح بنشرها ورقياً 


أو تدا 


ولها تجاریا 


Imperfective 
verb 


Imperfective 
passive verb 


Imperfective 
verb direct 
object 


Imperfective 
verb prefix 


Imperative 
verb Subject 
and mood 
suffix 


Imperfective 
(command) 
verb 


Imperative 
verb object 


IV 


IV. PASS 


IVSUFF _ 
«DO:«PGN 


<IV<PGN 


IVSUFF_ 
<SUBJ:<PGN 


_<MOOD:<mood 


CV 


CVSUFF _ 
<DO:<PGN 


باق رید 


Comparative 
adjective 


Adjectival/ 
ordinal 
number 


Deverbal 
adjective 


Proper 
adjective 


الظرف 


Adverb 


Relative 
adverb 


Interrogative 
adverb 


الضمیر 


Pronoun 


ADJ COMP 


ADJ NUM 


ADV 


REL ADV 


INTERROG 
ADV 


PRON 


اهد 


هذه الطبعة 


اء من المركز 


ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


Imperative 
verb subject 


احرف 
preposition‏ 


Conjunction 


Subordinating 
conjunction 


الأداة 
particle‏ 


Connective 
particle 


Emphatic 
particle 


Focus 
particle 


Future 
particle 


Interrogative 
particle 


Jussive 
particle 


CVSUFF 
<SUBJ:<PGN 


PREP 


CON 


SUBJ_CONJ 


PART 


CONNEC _ 
PART 


EMPHATIC_ 
PART 


FOCUS_ 
PATR 


FUT PART 


INTERROG . 
PART 


JUS PART 


ede 


Personal 
pronoun 


Possessive 
Personal 
pronoun 


Demonstrative 
pronoun 


Relative 
pronoun 


Interrogative 
pronoun 


Nominal 
suffix 


Nominal 
suffix 


Determiner 


TP 


Punctuation 


Abbreviation 


«PRON «PGN 


PRON «PGN- 
|. POSS 


DEM 
«PRON «GN 


REL PRON 


INERROG - 
PRON 


NSUFF«Gen- 
«Num»? «Cas» 
<<Stt 


CASE <Def> 
<<Cas 


DET 


PUNC 


ABBREV 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


INTERJ | Interjection | التعجب‎ | | NEG PART | Negative | — ag 
p. particle : 
Response أداة‎ 
العلامات‎ : 
LATIN | Latin script | 7 n RC PART | conditional | جواب‎ 
اللاتينية‎ particle الشر ط‎ 
Foreign الکلمة‎ RESTRIC | Restrictive 70 
هن‎ word الأجنبية‎ PART particle | 77 ° " 
Typographical اخطاً‎ VERB Verb Sede 
TES error الکتای‎ PART paricje | اداة یل‎ 
LAS ۱ ۱ 
اه‎ Pea Weed Voc pag |, Vocnve ox ad 
word المجزأة‎ particle 
DIALECT Dialectal الکلمة‎ 
word العامية‎ 


الجدول: ۱۰ فئة باکولترالکلامیة۱) 


es‏ نظم تلك السّهات النفردة في شکل Danza‏ من الورفییات العربية التتابعة 
للمفردة مثال ذلك DET-ADJ-NSUFF FEM SG*CASE ( p ASII as‏ 
(DEF ACC‏ لفردة “ak”‏ ۱ وقد استخدمت هذه الفئة Lad‏ في عنونة بنك 
aU dibus‏ العربيّة PATB‏ بالأقسام PRAI‏ ویوضح الجدول رقم ۱۱ مثالا 
ad‏ بنك بنسلفانيا العريي بفئة باكولتر للأقسام الكلاميّة لجملة «سعودیون يشكون 
من عنف أمريكي خلال التحريات عن هجیات ۱۱ آیلول». 


(1) Habash , N. (2010). Ibid. P.81. 

(Y)‏ المتجه (Vector)‏ هو مصطلح رياضي یدرس - تحديدًا - في الجبر الخطي Linear algebra‏ ویمکن أن یعرف بأنه 

خط یتجه من نقطة لأخرى» ویتم تحدید خصائصه بمقدار طول هذا الخط R‏ ویستخدم مع نظيره الصفوفة Matrix‏ ني 

بناء نظم البیانات وتنسیقها بها یتوافق مع معطیات آلیات التعلم الآلي. ینظر: 

Anton, H. & Rorres, Ch. (2010). Elementary Linear Algebra. John Wiley & Sons, 

Inc. 10th edition P.228. 

(3) Maamouri, M & Bies, A & Bukwalter, T & Mekki, W. (2004).The Penn Arabic Treebank: 

Building a Large-Scale Annotated Arabic Corpus. In Proceedings of NEMLAR Conference on 


Arabic Language Resources and Tools. P.5. 


—AN- 


هذه الطبعة 


إهداء من المركز 
ولايسمح بنشرها ورقياً 
آو تداولها تجارياً 
الکلمة الأقسام الكلامية الصطلح العربي 
NOUN-NSUFF MASC PL |.‏ ۱ ۱ 
سعودیون NOM‏ اسم +مذكر_جمع_مرفوع 
ف مضارعة للمذک اله 
zn IV3MP-IV-IVSUFF SUBJ:MP‏ و ue 9 PU‏ 
t ToSU 5 C vi‏ 
MOOD:I dre‏ توت e‏ 
متصل_حالته الإعرابية:الرفع 
xus PREP T‏ 
NOUN-CASE INDEF GEN TT‏ اسم +غير مضاف _ مجرور 
E iA ADI«CASE INDEF GEN VS‏ 
خلال PREP‏ حر ف جر 
DET+NOUNINSUFF_FEM. | y‏ أداة تعريف+اسم +مؤنث_ 
PL*CASE DEF GEN‏ جم+مضاف_جرور 
ue PREP ps‏ 
NOUN-NSUFF FEM‏ | " 
bd ‘¢ + -‏ 
PL4CASE DEF ACC d‏ سم +مؤدث_جمع + مضاف جرور 
NUM M‏ عدد 
NOUN PROP:CASE INDE. | 4‏ | ۳ 
+ 
یلو GEN‏ سم علم+غیر مضاف_مجرور 


الجدول اموي ساي لعي E‏ مية ٩‏ 


ور الاشارة هنا إل أن الات الفرعيّة (iladl) Z‏ يختلف عددها عند UFa‏ 
باختلاف نوع oa)‏ من حيث کونه p‏ ۶ 10101200 أو غير ۳۳ «unTokenized‏ 
إذ نجد - على سبيل المثال- في فئة السات الستخدمة في بنك بنسلفانیاالعريي سمتي 
العطف (CON)‏ والضمر (PRON)‏ مستقلّین duelo‏ فلا ge‏ مع سات أخري» 


)1( هذا JEL‏ مقتبس من بنك بنسلفانیا الشجري ATB‏ 


-//- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بد شرها ورقياً 
أو تداولها تجارياً 


وهذا یعود إلى أن بنك بنسلفانيا العربيّ يتبع نهج فصل الرّوائد Clities‏ في التَص. وقد 
يصل عدد السّیات GL) Ze i‏ أي السّمات المکن ردها لأنواع الفردات المختلفة 
کیا الثال الذي ذكرته آنفا إل ۵۰۰ سمةء Ce‏ قد يضل العدد في nl‏ غير الجر بل 
PNE‏ 


۲-۲ فئة بییز الکلامية BIES Tag Set‏ 
pun‏ من مبادی del NT‏ التي تقد تقتضي احکام العطیات ada‏ وتستوجب 
Claus‏ مطردّا» قامت آن Ann Bies” xs‏ و دان بایکل Dan Bikel‏ باستخلاص 
xt‏ عن للاقسام الكلامة sad‏ الع Reduced Tagset (RTS)‏ من فئة باکولتر 
الكبرى» تماهي فئة الأقسام الكلاميّة الستخدمة في بنك بنسلفانیا AX)‏ الإنجليزيّة 

وذلك بهدف تحسین آداء التحلیل ie oeil‏ ا 

وانطلقت را ييه QUSS‏ لخاد ريه على غرار تة تقسیم باکولتر 
نی غير أنه انتهجت نیج فة الأقسام الكلاميّة > نجل نيا WIN‏ شبكة 
البیانات AUI‏ 3 1.06 5:3 يناك بنسفانیاالانجليزي؛ لبضل بعدد سیات تلك tall‏ 
ال آنشاها ال ۲۵ وا تغل ضمن الفقانت ASTE‏ الاصغر سنج من 
هت عزو ال شالف - نحویة. 

على el‏ من تقاژب إحكام تلك الفئة op EAI‏ محاكاتها للأقسام الكلاميّة 
الإنجليزيّة atn il‏ من edo, Allo dall‏ أساسيًا في استنباط العّلاقات 
ci oc‏ مثال ذلك استخدام رمز 11 مع جميع الات بغض النظر عن خصائص هذه 
col ali‏ سواءً أكانت اسم فاعل أو صيغة مبالغة أو صفة مشبهة أو Cal‏ منسوبًا“)..» 
وهذا يرجع إلى أن all‏ الکلامة A)‏ الإنجليزيّة لا توجد بها تلك الخصائص. 


(۱) باحث مساعد بدرجة ( خبیر» بمؤسسة شبكة البيانات اللغوية LDC‏ وتعمل على العديد من المشروعات في العنونة 
النحوية والدلالية للغة العربية والإنجليزية. 
Habash , N. (2010). Ibid. P.80.‏ )2( 


(3) Diab, M.T. (2007). Improved Arabic Base Phrase Chunking with a new enriched POS tag 
set. In Proceedings of the 5th Workshop on Important Unresolved Matters, Association for 
Computational Linguistics (ACL), Prague. P.89. 


(4) Habash , N. (2010). Ibid. P.80. 


eA uc 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


ویوضح امحدول رقم ۱۲ سمات فئة بییز الكلامية القلصة التي آقرتها مؤسسة شبكة 
البیانات اللغوية بجامعة بنسلفانیا في عام ٤‏ ۲۰۰م. 


Noun الاسم‎ 
NN singular common noun or abbreviation اسم شائع (مفرد)‎ 
NNS plural/dual common noun (gto آو‎ e^) اسم شائع‎ 
NNP singular proper noun اسم علم (مفرد)‎ 
NNPS plural/dual proper noun أو مثتی)‎ ede اسم‎ 
CD cardinal number عدد‎ 
Pronouns الضمی‎ 
PRP personal pronoun ضمير شخصي‎ 
$PRP possessive personal pronoun ضمير ملكية‎ 
WP relative pronoun ضمير وصل‎ 
الصفة‎ 
JJ Adjective الصفة‎ 
الظرف‎ 
RB Adverb الظرف‎ 
WRB relative adverb ظرف بصيغة الاستفهام‎ 


—-Q.— 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


CC coordinating conjunction حرف عطف‎ 
IN preposition or subordinating conjunction | حرف جر/ حرف عطف‎ 
el 
DT determiner/demonstrative pronoun اسم اشارة‎ ENS 
RB Particle أداة‎ 
IN preposition or subordinating conjunction | حرف جر/ حرف عطف‎ 
الأفعال‎ 
VBP active imperfect verb فعل مضارع‎ 
VBN passive imperfect/perfect verb فعل مبني للمجهول‎ 
VBD active perfect verb فعل ماض‎ 
VB imperative verb فعل آمر‎ 
الوظيفية‎ 
UH Interjection أداة تعجب‎ 
PUNC Punctuation التر قيم‎ 
posse NUMERIC COMMA الفاصلة العددية‎ 
NO ۵ NO ۵ كلمة غير محللة‎ 
FW Foreign word كلمة أجنبية‎ 


C? فئة بييز الكلامية المقلصة‎ VY: sad 
(1) Habash , N. (2010). Ibid. P.80. 


—-\ ات 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


وبمّلاحظة فئة مورفيات بييز الكلاميّة يتين لنا LEE‏ تعتمد بصورة سافرة على 
لطر لقت - نحويّة لِلغة الإنجليزيّة دون أن ُراعي خصوصيّات اللّخة العربية, 
مثال ذلك استخدامها لرمز الظّرف بصيغة الاستفهام 5 الذي ینش بتوصيف 
d‏ اللغة الإنجليزيّة where when‏ این یمتلکان طابع التظام الكتابي لصيغة 
الاستفهام في del iE‏ کیا پلاحظ أنها لم تعر اهتمامًا لمورفيمات الفصائل cll‏ & 
gia‏ -الشخص- التعريف والتنکر) التي تعد - بوصفها آداة لاظهار HT‏ 
وال لطي بين المقولاات E unc‏ - مكوئًا من مکونات الاقسام الکلامیة» وكذلك 
العلامات الاعر ای 


à ۶-۲‏ بادت الكلامية PADT Tag set‏ 
أعلن معهد col A‏ التطبيقيّ Š paly‏ بجامعة تشارلز ببراغ Prague‏ في مطلع 
عام 4 ۲۰۰م عن مشروع بناء «بنك شجري اعتادي للغة Prague Arabic, JI‏ 
Dependency Treebank (PADT)‏ یعتمد في «x‏ على البنية الاعت‌ادية اکن 

بهدف توفير مورد وی للأغراض البحثيّة والتجاريّة ية في معالجة اللّخة الطبيعيّة. وقد 
asas‏ القند المع ch s dd‏ للمنظومات ال امختلفة قد متا 
على هيئة طبقات iet‏ سل معالجة ead‏ الطبيعية ias‏ من التحليل 
العجمي مُرورّا بالأجزاء الكلاميّة وانتهاء بالتخليل «gll‏ وما bog‏ في هذا المقام 
الأجزاء الكلامية 

وقام فریق de‏ نی مشروع بنك براغ الشجري CREER‏ کلام 
lese le ded‏ ري eli‏ ی ساد و الصيل 
الجر فيا بعد. «وقد تضمنت à JA ElixirFM ۳ à‏ الذي استلهم منهجيته 

من الصرف الوظيفيً»؛ بهدف تحليل المد ة ال التي ينطلق منها المشروع اللوي 
تحلیلا شبه آليّ أي يحتاج إلى المراجعة والتعديل. 


(1) Smrž, O & Bielicky, V. et al., (2008). Prague Arabic dependency treebank: A word on 
the million words. In Proceedings of the Workshop on Arabic and Local Languages (LREC) 
2008.Marrakech, Morocco. European Language 2008.Marrakech, Morocco. European 
Language Resources Association. 


(2) Habash , N. (2010). Ibid. P.84. 


دعاقت 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


كان الأساس امن tos‏ تصميم هذه الفئة الكلاميّة هو إمكانية إخضاع السّمة 
الكلاميّة زین آساسین: هما القسم الكلاميٌ والفصيلة النّحوِيّة التي يحملها؛ لتکون 
آکثر E‏ با الستخدمة GL ts d‏ ا 
معدل عل الما الخلا ية من الصيغة الوظيفيّة بعکس ما تسیر عليه الفنات الأخرى 
بالاستدلال من الصّيغة الشّكلِيّة OS‏ ويوصّح الشّكلان ۲۰ و۲۱ طرّقّ استمداد 
السّمة الكلاميّة من الصيغة الصَّرفيّة 


Form al-lA-silkIyaTu al-là-silktyatu آللاسلکتة‎ 


Morph al >| lA >| FiCL |< Iy |< aT |<< ۳ 
Tag A FS1D 

Form lA-silkIy lá-silkty لاسلی‎ 
Morph 18 >| FiCL |< Iy 

Root "5 1 k" 

Reflex wireless, radio 

Class adjective 


الشکل:۲۰ خرجات محلل 1111573/1-نموذج O «s SUI"‏ 


تستند السَمة الكلاميّة ق هذا النموذج على الصيغة المجرّدة Form‏ من 23143 
eel JUI‏ الكت قن اجره الأول من السّمة الكلامية £ للقسم الکلامی الذي تنتمي 
إليه الصّيغة» ثم ا السّمة الأخرى بالبحث Jl y SII à‏ للکشف عن الفصائل 
التحوية» وهذا ما يبدو في نموذج مُفرّدة الک إذ a d‏ الصّيغة من الرّوائد 
واللواصق فأصبحت TEANA‏ التي aa‏ علیها بالقسم الکلامي A‏ (الصفة) $ e‏ 
انطلق القسیم الثاني للسّمة الكلاميّة الأخرى من Jb asl a‏ التعريف» وتاء التّأنيث» 
وعلامة الاعراب)؛ AR‏ عن الفصائل النّحويّة ية التي تحملها الفردة» فكانت اروز 
0 دلالة على الموَّنَّثْ الفرد الرفوع العرّف. 


(1) Smrž, O & Bielicky, V. et al., (2008). Ibid. 
(2) Smrž, O & Bielicky, V. et al., (2008). Ibid. 


ET at 


هذه الطبعة 


إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 

Form All'Asilokiy apu اللاسلكيّة‎ 
Morph Al-4lAsilokiy^ +ap + نا‎ 
Tag DET*ADJ*NSUFF. FEM SG*CASE DEF. NOM 
Gloss the wireless / radio + [fem.sg.] + [def.nom.] 
Lemma | a] Ky 
Root implicit in the lexicon 


الشکل:۲۱ خرجات محلل Buekwalter‏ -نموذج O» Es] SUI?‏ 
Ul‏ الفعة الكلاميّة الستخدمة في fie‏ باکولتر الصَّرقٌ فقد تستند على الضّرف الكل 
Morph‏ الذي یتمثل في تحدید الوحدة الصَّرفيّة أو المورفيم» إذ نجد في e I‏ أعلاه 
أن i42JI‏ الكلاميّة DET-ADJ-NSUFF FEM. SG*CASE DEF NOM‏ قد 
انطلقت من تفكيك الكلمة «اللاسلکیة» إل مورقيات متتالية «ال+لاسلکی ةة 


ثم وَصف كل مورفیم على حدة. 

وقد اشتملت تلك الفئة الكلاميّة على خمسة أقسام Eas‏ ( الفعل - الاسم - 
yal‏ - الأداة - أخرى) تتخللها عدّة آقسام فرعي لتصل بذلك إلى ۰ قسياء ىا 
تضمنت bae‏ من الفصائل ed ll‏ لیبلغ جمل هدس اتا الو ست 
يوضّحها الجدول رقم M‏ 


Verb الفعل‎ 
VI imperfect verb فعل مضارع‎ 
VP perfect verb فعل ماض‎ 
VC imperative verb PE فعل‎ 


(1) SmrZ, O & Bielicky, V. et al., (2008). Ibid. 


-4£— 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


Noun الاسم‎ 


noun 
proper noun 
adjective 
adverb 
abbreviation 
Pronoun الضمیر‎ 
pronoun 
demonstrative pronoun 
relative pronoun 
Particle الأداة‎ 
particle 
interrogative particle 
negative particle 
conjunction 
preposition 


interjection 


-4۵- 


SD 


SR 


FI 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


آخر ی Other‏ 
رمز رسومی G graphical symbol‏ 
عدد number‏ 0 
أداة تعریف معزولة isolated definite article‏ 38 
السیات Features‏ 
INdicative‏ (الرفع) - ۹۱/01001176( لنصب)- Jussive‏ (الجزم)-(1 G)‏ حالة الاشتباه 
الاعراب i‏ 
صيغة البناء 6 معلوم)- Passive‏ (جهول) 
Ms‏ 1 )-2 (للمخاطب)-3 (للآخرين) 
dd‏ للمتکلم)- - خرین 
علامة انس (Masculine‏ للذ کر)- Feminine‏ )55544( 
علامة العدد Dual-G ,40 Singular‏ (المثنى)- Plural‏ (الجمع) 
الحالة الإعربية 60 13 JJ)‏ فع)- 2-80018176 4=accusative-( ~aU)‏ (للجر) 
التعریف Definite-( $) Indefinite‏ (معرفة)-156011660 Complex-(Gal:)‏ (مركبة). 


جدول:۱۳ فئة بادت الكلامية ”° 
تلتقي معظم سیات تلك الفثة الكلاميّة مع العدید من الفئات الكلاميّة الأخرى, 
غير أن وضع بعض السّمات تحت آقسامها الرئيسيّة يختلف نوعًا ما من فة لأخرى» 
وهذا یعود إلى طبيعة العَنْوّنة DLII‏ هذه السّمات. ومع ذلك نلحظ تيز هذه الفتة 
الكلاميّة ببعض السات الكلاميّة مثل تصنيفها للتعريف كأداة (à y Particle‏ الوقت 
ذاته فصيلة نحويّة (معرفة)» لا أنَّ الآخر لا یکون قسيً) إلا لاداة PER TERE‏ 


* 


(1) SmrZ, O. & Bielicky, V. et al., (2008). Ibid. 


zye 


هذه الطبعة 
إهداء من المركز 
ولايسمح بذ شرها ورقياً 
أو تداولها تجارياً 


Cos‏ 2 ا ن ف ان رش ey arab‏ که مساواق obl di‏ أذ 
المركبة عتلك أداءً للتعريف مثل الاضافة غير الحقيقية 0) 


۰-۲ فئة آر دی آی الكلامية RDI POS Tag set‏ 


يللاو الوه [Poire ue gli roe. o‏ العزي | 
توليد الكلام المنطوق من uad‏ العري eS‏ 
۱ اللسانية کک تقنيات اضندسة تقنية الذكاء 
ع e co‏ کیل ال 

وني سبيل ذلك قدّم الذكتور محمد عطیة!" الباحث بالشركة الهندسيّة لتطوير النُظم 
الرقمية à‏ بالقا هرة CS E erar‏ ضمن آطروحته للذکتوراة ينطلق من التحليل 
rund o‏ دلیلا هاديًا في التعرّف nd de‏ الكلاميةء ]5 یعتمد m Je‏ 
E es‏ 

وکانت نتيجة الاستقراء والاختصار الحصولٌ على أصغر فئة كلامية ممكنة من 
المورفيهات العربيّة» تحتوي على 57 نوعًا كلاميًاء يعرضها الجدول رقم ME‏ 


2 
0 


العامة 


(1) Habash, N & Roth, R. (2009). CATIB: The columbia Arabic Treebank.Proceedings of the 
ACL-IJCNLP 2009 Conference Short Papers.Suntec, Singapore. 
یشغل عدة مناصب هامة منها:‎ (Y) 
استشاري معالجة اللغات الطبيعية بالشركة اهندسية لتطوير النظم الرقمية - القاهرة.‎ 
لوکسور تكنولوجي - کندا.‎ E استشاري هندسة الررعيات بش‎ 
أستاذ زائر علوم حاسب وتکنولوجیا العلومات بالأكاديمية العرية للعلوم والتکنولوجیا والنقل البحري - مصر.‎ 
علمية رفيعة الستوی.‎ ib محکم دائم في آکثر من‎ 
اعداد العجم التاريخي للغة العربية بالدوحة.‎ it عضو في‎ 
یتمثل في الحلل الصرفي «میزان» الذي یعتمد على الورفیم کلبنة بنائية أساسية» وهو ما يميزه عن نظرائه ما يرتكز‎ )۳( 
للاطلاع‎ LA ,۸ على حصيلة من الكلمات؛ وهو ما یعزز من مرونته وتخطیتهلفردات اللغة العربية والتي تتخطی نسبة‎ 
RDI. (1993). http://www.rdi-eg.com/ar/Technologies/arabic nlp.htm والتجریب:‎ 
(4) Attia, M. (2004).Ibid.P.43. 


-۷- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


لا سایق 


موي 


«ال» التعريف 


Start-Of- Word marker 


Padding string 


Null prefix 


Conjunctive 


Confirmation by Laam 


Interrogation by Hamza 


Null suffix 


Object or possession 


pronoun 


Ist Arabic syntactic 
case 


2nd Arabic syntactic 


case 


Definitive article 


es ics 


SOW 


Padding 


NullPrefix 


Conj 


Confirm 


Interrog 


NullSuffix 


ObjPossPro 


MARF 


MANSS 


Definit 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


| 
الاسم فقط 


o 
لواحق‎ 
الاسم فقط‎ 


غير مضاف 


Nominal 


Nouns made of infini- 
tives 


NounlInfinit" like" 


Subject noun 


Exaggeration adjective 


Object noun 


Noun of time or loca- 


tion 


An Arabic feature of a 


specific class of nouns 


Possessive pronoun 


Relative adjectives 


maker 


Feminine 


Masculine 


Singular 


Binary 


Plural 


Adjunct 


NonAdjunct 


-44- 


Noun 


Nounlnfinit 


NounlInfinitLike 


SubjNoun 


ExaggAdj 


ObjNoun 


TimeLocNoun 


NoSARF 


PossessPro 


RelAdj 


Femin 


Masc 


Single 


Binary 


Plural 


Adjunct 


NonAdjunct 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


المصطلح العربي الصطلح الإنجليزي 


2nd or 3rd Arabic syn- Í ۳ 
MANSS MAGR dic سیات‎ 
T tactic case جرور‎ 
لواحق‎ 
3rd Arabic syntactic فقظط‎ oM 
MAGR سم‎ 
case جرور‎ 
Present Present tense سات مضارع‎ 
سوابق‎ 
Future Future tense الفعل فقط استقبال‎ 
AU 
Active Active sound f ma 
(للفاعل)‎ 
yi 
Passive Passive sound J qe 
(للمفعول)‎ 
Imperative Imperative آمر‎ 
Verb Verb جذع فعل‎ bilia 
là | 
Transitive Transitive verb لازم‎ Jed 
MAJA 4th Arabic syntactic 
case جزدم‎ 
Past Past tense ماض‎ 
cn t Present tense, or im- ETET 
resImpera 
p perative He 
SubjPro Subject form pronoun ضمر ر فع‎ 
; : سات‎ 
ObjPro Object form pronoun ضمر نصب‎ B 
لواحق‎ 
2nd or 4th Arabic syn- | A 
MANS. 7 l ١ diis 
5 tactic case جزوم‎ 


اه 1ت 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


ce 
وظيفية‎ 


ثابتة 


حرف جر 
حرف نداء 
جار وجرور 


اسم موصول 
اسم إشارة 


أداة استفهام 


جازمة 


Preposition 
Interjection 


Preposition-Pronoun 


Compound 
Relative pronoun 
Demonstrative pronoun 
Interrogation article 


For specific articles that 
make the consequent 
verb in the 4th Arabic 


syntactic case 


Feature of a class of 
Arabic conditionals 


Feature of a class of 
Arabic conditionals 


Arabic specific article 
Arabic specific article 
Article of exception 


A class of articles that 
have no syntactic effect 


Feature for certain kind 


of Arabic adverbs 


sae 


Prepos 


Interj 


PrepPronComp 


RelPro 
DemoPro 


InterrogArticle 


JAAZIMA 


CondJAAZIMA 


CondNot 
JAAZIMA 


LAA 
LAATA 


Except 


NoSyntaEffect 


DZARF 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


A class of particles that 


make the subject of the 
ParticleNAASIKH consequent nominal حرف ناسخ‎ 
sentence in 2nd Arabic 


syntactic case 


A class of auxiliary 

verbs that make the 
predicate of the conse- a ف‎ 
اا ا‎ quent verbal sentence oe فعل‎ box 
in 2nd Arabic syntactic 


case 


Arabic specific class of 


. particles that make the 
ParticleNAASSIB . ناص‎ 
consequent verb in 2nd 


Arabic syntactic case 


MASSDARIYYA Arabic specific article مصدرية‎ 


كلمة اه 
Transliterated Arabic‏ 


مكتوبة بحروف Translit‏ 


string الأجنبية‎ 
4237 


جدول: ١5‏ فئة آر دي آي الكلامية 
وبمّلاحظة فئة الأنواع الكلاميّة في امحدول السابقء يتبيّن ما يلي: 
e‏ انطلاق الفئة الكلاميّة من العنصر التحلیلن المورفيميٌ بعكس ما تسیر عليه الفتات 
الأخرى التي كان منطلقها القسم الكلاميٌ لا المورفيم؛ لذا تسمّي كل مورفيم بالنوع 
الکلامی. 


E 


Lic 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


* تشتمل الفئة الكلاميّة على عنصرَيْن غير «oi sd‏ وهما بداية الكلمة SOW‏ 
SIU Padding 14.1,‏ مع آسلوب التعلم الإحصائيٌ EN d‏ 

تتفرّد الفئة الكلاميّة بالعدید من الورفیات العربيّة التي تختص بجع الکلمة 
ولواحقها. 

e‏ تطرقت الفئة الكلاميّة لسمة نحويّة Ghe‏ ألا qas‏ الجارٌ والجرور 
0 لا ستخدامها مع حرف الحدٌ- ذي المحرف الواحد- المتشابك مع 
الضمی مثل (بهاء لها به له ...). 

* تُؤرجح الفتة الكلاميّة بين احالات النّحويّة للمفردات باستخدام السّمة القطعيّة 
مثل «منصوب. مجرور» والسّمة الاحتاليّة «منصوب أو مجرور» منصوب أو جزوم». 

G l التموذج‎ Us الفئة الكلاميّة عن الكلمة الأجنبيّة بكل ما لا 533 في‎ Lese 
الذي بنيت عليه هذه الفئة.‎ Morphological Model 

وقد اعتمد الدكتور غطية على منهجية متكاملة في التصميم والاستقراء 
والاختصار”" يمكننا أن نلخصها كالآتي: 

© الشموليةء بحيث تشتمل BAN‏ الكلامية على أي سمة نحويّة غير TEC e‏ 

ه الاطراد والتناشق» بحيث لا يوجد في الفتة الكلاميّة سمة أو نوع کلامي يكافئه 
نوع كلامي آخر. 

«الانتقاء والإيجاز بحيث يتم استقراء FSU‏ المورفيميٌ» ومن نَّمّ استخلاص أصغر 

وبناء على توخيه هذه المبادئ التي انتهجها في تصميم فئته الكلاميّة» فقد el‏ بتسمية 


)© أي حشو المتجه الكلامي بتلك السمة» بحيث يتم التوحيد في عدد الأنواع الكلاميّة لكل كلمة؛ حتى تتوافق كل 
الكلمات في عدد الأنواع الكلاميّة؛ تلبية لآلية elei‏ الاحصائي. 
Attia, M. (2004).Ibid.P.44.‏ )2( 


zi aus 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقياً 
أو تداولها تجاریا 


كل مورفيم في الکتز المورفيميّ بالأنواع الكلاميّة التي تستوفي خصائصه «D usd‏ 
ويوصّح الجدول رقم ۱۵ أمثلة على تسمية المورفيمات العرييّة بالأنواع الكلاميّة. 


متحه العناوين الكلامية 
سابقة؛ ٩‏ ال JI]‏ التعریف] 
ا TT‏ تت cU]‏ مضارع» مبني 
للمعلوم] 
صيغة اشتقاقية منتظمة؛ 1۸۲ ُماعل [اسم» اسم فاعل] 
صيغة اشتقاقية منتظمة؛ JUS ٩۷‏ [اسم» مصدر] 
| کد ^ 3 
صيغة اشتقاقية غير منتظمة؛ ۲۹ ملاك Gripe‏ من الصرف 
ler‏ 
عا 4 [اسم» مذكر. مفرد» ضمیر 
رفع] 
جامد؛ ۳۹ ۳ [اسم؛ mem‏ مضاف» 
مرفوع ] 
حقة؛ ۲۷ لات [مؤنثء جمع] 
[UA (orent i ۳‏ ضمير رفع» 
حقة؛ ۱۹۵ يان E‏ مت مثنى» غير 
مضاف» مرفوع] 


احدول lo:‏ تبون یمه بصن eiui‏ بااتو الكلامية ا 


اعتمد الدُكتور عطية في بناء عمليّة العَنْوّنة | 1 ميه على التحلیل d AI‏ حيث 
AI‏ مورفيم الصّيغة - من حيث كونه مصرّفا أو غير مصرّف- دليلًا مستأنسًا في تحديد 


(1) Attia, M. (2004).Ibid. P.46. 
(2) Attia, M. (2004).Ibid. ۰ 


حر 1ت 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 
خصائص جذع الکلمة» وكذلك مورفییات السّوابق واللواحق في تحديد خصائص 
لواصق الكلمة وزوائدها. وهو بذلك يُغاير الطرّق المعهودة في بناء عمليّة العَنُونة؛ لأنّه 
x I cab y‏ في استنباط علامات التشكيل Zo ue y‏ للکلیات السّابق تحليلها صرفيًا. 
m ١‏ گم ور م2 3 ف 1 ae‏ 
ويعرض Uo‏ رقم ١5‏ مثالا معنونا بالانواع الكلامية (اللغوية) - التي تظهر في 
شكل متّجهات - حملة «وقد صرحت رئيسة الوزراء في نيوزيلندا». 


POS Tags vector متحه العناوین الكلامية‎ 


[Conj,NoSyntaE ffect,NullSuffix] [عطف. غير عاملت لا لاحق]‎ di 


NullPrefix, Verb,Past,Single,Fe] [eip -— dd apa y] ف‎ 
t ۰ صرحت‎ 


[min 
[NullPrefix,Noun ,Single,Femin] سابق» اسم» مفرد. مؤنث]‎ Y] Te 
Defini;Noun,Plura,NoSAREN] | جمع منوع من‎ «pl التعريف«‎ UI] m 
[ullSuffix PERTE الوزراء‎ 
[NullPrefix, Prepos,NullSuffix] سابق» حرف جر لا لاحق]‎ Y] 8 
[Translit] [كلمة أجنبية مکتوبة بحروف عربية]‎ NE 


الجدول:١٠‏ نموذح معنون بفئة آر دي آي الكلامية ۲۷ 


1-۲ الفئة الكلامية القلصة الوسعة 
(The Extend Reduced Tag set ERTS)‏ 
أدركت ST‏ منى دياب مدى القصور الذي لحقته فئة بيبز الكلامية بعد ol‏ 
عجزت عن UA‏ احتواء AU‏ العرییّة» فاثرت أن تضيف بعض الشات الى تتفق 
ووجهةً نظرها من يت ملاءمتها لطبيعة Gu‏ ال وذلك لاستخدامها في نظام 


(1) Attia, M. (2004).Ibid. P.47-48. 


حدق 1ت 


هذه الطبعة 
إهداء من المركز 


ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


أميرة AMIRA‏ وهو نظام متعدّد المهامٌ (تجزئة النصوص.ء العَنْوَنة بالأقسام الکلامیت 
التحليل ال Shallow Syntactic Parsing 24 —JI G‏ ) يرعاه مرکز آنظمة eis‏ 
CELS Zy gl‏ بجامعة کولومبیا بالولايات الَحدة الأمريكيّة. O‏ 

وقد اقتبست فتتها الكلاميّة ية من فتة باكولتر الكاملة 22 ا مجرأ؛ لتبلغ بالإضافة لفئة 
n‏ ۷۲ سمة» وعثلت الاضافات في الفصائل à & cil‏ (العدد واگنس» Yili‏ 
BU T E a tl‏ بو 
بالرّمز 5 للجمع» re‏ 25 للجنس بالرمز ۴ للمُوَنّث و بالرّمز SAM‏ أمًا التعريف 
(وتحديدًا أداة التعريف) فر و مز أداة التعريف التي تظهر مع الأسماء (e Du‏ 

وقد ios Mec‏ اا اوتا s) AS‏ وبين go n‏ 
اللغرية LDC:‏ دين خلال mu isle iae ile‏ النار الجماعى PTET‏ 
أوجه الاختلاف بين الفئات الكلاميّة الثلاث کما في الجدول رقم ۰۱۷ 


الفئة القلصة الوسعة 
ERTS‏ 


RTS فئة بییز‎ FULL باكولتر الكاملة‎ a5 


NOUN- NSUFF FEM 
SG*CASE IND NOM : 


ADJ+ NSUFF FEM 50+ 
JJF JJ in isle 
CASE_IND_ NOM s 


NNM NN NOUN-* CASE DEF ACC | حادث‎ 
DET+ NOUN- CASE DEF 
DNNM NN =- =] الثار‎ 
GEN 
DET- ADJ+ CASE. DEF 
DJJM JJ = = الجاع‎ 


GEN 


(1) Diab, M. (2007). Improved Arabic Base Phrase Chunking With a new enriched POS tag set. 
Proceedings of the 5th Workshop on Important Unresolved Matters, Prague, Czech Republic. 


(2) Habash , N. (2010). Ibid. P.83. 


ex wee 


هذه الطبعة 
إهداء من المركز 


ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الفئة القلصة الوسعة 
ERTS‏ 


RTS فئة بییز‎ FULL با کو لترالکاملة‎ a5 


M m NOUN-NSUFF MASC |), 
۰ DU GEN (eem 


جدول: ۱۷ مقارنة بين الفئات الكلامية الثلا() 
ويتّضح من عرض هذه الفئات الكلاميّة أن الفئة المقلّصة الموَسّعة آکثر إحكامًا 
في حمل مورفییات الفصائل النّحويّة إذ نجد أن فئة الأسماء والصفات تحملانٍ سمة 
التذكير في حال الإفراد بعكس ما تسير عليه فئة باکولش في حين تتفرّد فئة باكولتر 
بالعلامات الإعرابيّة التي تحملها أجزاؤها الكلاميّة» كا تعبّر عن مورفیمات الكلمة 
بمتَجّه کلامي من آلر موی محكمه العلامة الدالة على Soo e‏ تعبّر الفئات 
الأخرى عن مورفییات الكلمة برمز كلاميٌ واحد. 


AI Qrainy tag set فئة القرینی الكلامية‎ ۷-۲ 

قدّم الذکتور شحادة القريني ذ ضمن آطروحته للذکتوراة Ab‏ کلام Z i E‏ 
Pc‏ 5 بغرض sto‏ م معنو Q‏ ی كلامي Arabic Morphosyntactic Tagger‏ 
aie ab AR a V RC‏ تشترك في مطلبها ŠIS‏ 
التطبيقات للع" " وقد اعتمد القريني في تقسیمه للاقسام الكلاميّة de‏ سیم 
تلا eno‏ - فعل -أداة ) بالاضافة لعلامة (e AI‏ ليصل بتقسیمه إلى آربعة آقسام 
as‏ تتخللها عدة أقسام فرعية» ثم أضاف في فتته تلك مورفیمات الفصائل النحوية 
والعلامات الاعرابية التی تحملها فتات الأفعال والأسیاء. 

وبهذا قد اشتملت تلك الفثة على EE YA‏ فرعيًا من الأقسام الكلاميّة و١٠‏ مورف 
من الفصائل التحويّة ية والعلامات الاعراییّق وعند اتحاد هذه الأقسام الفرعيّة 
مورفیمات الفصائل od É oc‏ ا 


(1) Diab, M. (2007). Ibid. 2۰ 


(2) Alqrainy, Sh. (2008). A Morphological - Syntaical Analysis Approach For Arabic Textual 
Tagging. Thesis PhD in Computer Science. De Montfort University. P.25. 


(3) Alqrainy, Sh. (2008). Ibid.P.32. 


Um 


تتورّع على الأقسام الرئيسيّة 


هذه الطبعة 
إهداء من المركز 


ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


١٠١١ be‏ اسم» ۰ فعلاء 4 أداوات» علامة ترقيم» 


مثال ذلك كلمة «یشاهدون» bx‏ ب VePIMaPTThDc‏ (فعل مضارع _مذکر _ c^‏ 


_ ضمير الغائبین_مرفوع).(" 


ویوضح الجدول رقم ۱۸ الفئة الكلاميّة دون الفصائل Éy‏ والعلامات 
الإعرابية» فاشتمل الفعل على ثلاثة ة أقسام فرعي والاسم على سبعة عشر CB‏ فرع 
والأداة على سبعة أقسام فرعي بينم اشتملت علامة الترقيم على قسم فرعي واحدٍ. 


المصطلح الانجليزي 


الفعل 


Perfect verb 
Imperfect verb 
Imperative verb 
الاسم‎ 
Proper noun 
Common noun 
Adjective noun 
Infinitive noun 
Relative noun 
Diminutive noun 


Instrument noun 


-—— 


VePe 


VePi 


VePm 


NuPo 


NuCn 


NuAj 


Nulf 


NuRe 


NuDm 


Nuls 


(1) Alqrainy, Sh. (2008).Ibid.P36. 


اسم وصل 
اسم الشرط 
اسم الاشارة 
اسم استفهام 
الظرف أو الحال 
اسم عددي 


اسم أجنبي 


حرف الجر 
أداة النداء 
أداة عطف 


أداة استثناء 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


Noun of Place 


Noun of Time 


Pronoun 


Conjunctive noun 


Conditional noun 


Demonstrative noun 


Interrogrative noun 


Adverb 


Numeral noun 


Foreign noun 


أداة 


Preposition 


Vocative Particle 


Conjunction Particle 


Exception Particle 


Annulment Particle 


Subjunctive Particle 


حرة —- 


NuPn 


NuTn 


NuPs 


NuCv 


NuCd 


NuDe 


NuIn 


NuAd 


NuNn 


Fw 


PrPp 


PrVo 


PrCo 


PrEx 


PrAn 


PrSb 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أواتداولها تجارياً 


PrJs Jussive Particle أداة جزم‎ 
ji 
Pun Punctuation mark علامة الثر قيم‎ 


جدول:۱۸ فئة القريني الكلامية“ 


ويلاحظ مدى EI‏ بين تلك الفئة وفئة حوجة الكلامية» حيث إِنَّ كليهم| ينطلق 

من الحو العري GU‏ إلا أن i‏ خوجة eL‏ دائرة الأقسام الكلاميةء فتقسمها إلى 
خسة أقسام رئيسيّ E‏ تزيد الأقسام الفرعيّة في فئة القرينيّ؛ لتقطي السات الصّرف 
- نحويّة الأكثر استخدامًا في تطبيقات معالحة AXE‏ الطبيعيّة. 


The CATIB Tag set كاتب الكلامية‎ i ۸-۲ 


شرع مركز آنظمة RET‏ الحاسويّ CCLS‏ بجامعة كولومبيا في عام ۲۰۰۸ م في 
بناء بنك شجر E i‏ العربيّة The Columbia Arabic Treebank (CATiB)‏ بذعم 
من وزارة الدّفاع ÉLAN‏ بهدف الترجة اللي وقد راعی في eal‏ النهجية تقليل 
الوقت والجهد ÁI‏ خضعان لحجم العلومات AU‏ 33 الراد اضافتها i SU‏ 
ة الإسراع من العَنْوّنة اليَدِوِيّة مع مراعاة الحافظة على الفروقات DU‏ 
فقد eS‏ النهج القتصد في إحكام حجم الفتة e:‏ 
pal‏ كلاميّة. 

ودر الاشارة إلى ol‏ التقليل مع الإحكام في سیات الفثة الكلامة قد آثبتا فائدتهی| في 
ضوء استخدام آسالیب الم الإحصائيٌ "M‏ تکون قادرة عل الدويدفة s‏ کانت 
معطياتها ao I‏ أكثر تحديدًا وإحكامًا. 


f ac 


(1) Alqrainy, Sh. (2008).Ibid.P.33. 
(2) Habash , N. (2010). Ibid. P.83. 


- e 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


. وقد انطلقت الفئة الكلاميّة من النّحو العري التقليديّء فاعتمدث على التقسيم 
الثلاثي مضيفة إليه قسّا رابا آلا وهو علامة e AE‏ ثم قسّمت كل قسم من QAI‏ 
oss JI‏ (الفعل والاسم) إلى أقسام فرعیة(...وبهذا تصل إلى ستة أقسام یوضحها 
Jesi‏ رقم ۲۲: 


CATIB POS Tag set فئة کاتب الكلامية‎ Y الشکل:‎ 


على I‏ من eati ii»‏ التي أحرزتها تلك الفئة الكلاميّة في تطبيقها على بعض 
تطبيقات معاطة اللخة الطبيعيّة» فانها تفقد الكدر من الات التی oed‏ عل تحدید 
العلاقات التّركيبيّة في الجملة العربيّة» ولذلك تم توسعتها لاحقا بربط السّمة الكلاميّة 
بالسّابقة واللاحقة التى تشغلها في الفردة مثل كلمة «الکاتبون» التي كانت تُعَنُونَ ب 
(NOM)‏ أصبحت تعنون هكذا (1101/1+0+:41) في ضوء O, iaw gl‏ 

ویوضح الجدول رقم Y‏ مثالا من ESA‏ بنك كولومبيا الشجريٌ لجملة «وقال رود 
لارسن متحدثا للاذاعة العامة النرويجية « أن أر كاي» أنه« يمكن الآن تشبيه المنطقة من 
عدة نواح ببرمیل بارود بفتيل مشتعل». موصّفة بالأقسام الكلاميّة. 


(1) Habash , N. (2010). Ibid. ۰ 
(2) Habash , N. (2010). Ibid. P.83. 


12 11ج 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


POS Tags 


PRT 


VRB 


PROP 


PROP 


NOM 


PRT 


PROP 


PROP 


PROP 


PNX 


PROP 


PROP 


PROP 


PNX 


PRT 


NOM 


PNX 


-\\ Y- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


POS Tags 


VRB 


NOM 


NOM 


NOM 


PRT 


NOM 


NOM 


PRT 


NOM 


NOM 


PRT 


NOM 


NOM 


PNX 


PNX 


علامة ترقیم 


علامة ترقیم 


امحدول:۱۹ فئة کاتب الكلامية - نموذج العنونة بالأقسام الكلامية O‏ 


(۱) هذا المثال مقتبس من بنك کولومییا الشجريء وقد زودني به الأستاذ الدکتور نزار حبش. 


e 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


وبمّلاحظة JULI‏ السابق يتبيّن لنا الآتي: 

Ke T تعتمد بصورة سافرة عل ال ال ال وائد‎ PS عَنْوَنة هذه الفئة الكلاميّة‎ ole 

© أن سمة NOM‏ تشغل الاسم والصّفة والظرف والصّمير بنوعيه ال والنفصل...» 
Gs‏ سمة PROP‏ تشغل أسماء الأعلام الفردة وال رکبة. 

ه أن سمة PRT‏ تشغل حروف العطف والجرٌ والحروف المصدريّة وأدوات dj E‏ 


ole‏ سمة VRB‏ تشغل الفعل المبني للمعلوم بالإضافة إلى أفعال كان وأخواتها وكاد 
وأخواتبهاء c‏ سمة VRB-pass‏ تقتصر على الفعل البني للمجهول. 


The Kulick Tag set فئة كاليك الكلامية‎ ٩-۳ 


قام سیث كاليك Seth Kulick‏ في اطار الشروع البحتي الذي ترعاه مُؤّسّسة شبكة 
البیانات LDC à‏ للمقارنة بين دقة ة التحليلات cxt YI & cil‏ المختلفة لا 
e‏ بين العربيّة والإنجليزيّة وکذلك الصيئيّة بتصمیم فة ial] EAS‏ العربي oU‏ 

ما يرتكز عليه Jie‏ بايكل ixl Bikel's parser‏ الإنجليزيّة من فئة بنك بنسلفانيا 
y‏ باعتباره r‏ ذهبیّا للمقارنة بین تلك i cdi zél‏ الختلفة؛ وذلك 
لکفاءته التحليلة. ^ 

وسعيًا وراء لوغ ال هدف المنشود» فقد اعتمد كاليك في فتته الكلاميّة على فئة بييز 
oa‏ إليها بعض السّمات؛ كي تتناسب والنموذج o lll‏ أي فئة بنك بنسلفانياء 
ویمکن أن تصنف هذه الات إلى خسة تصنیفات: 19 


Su agis eil! علامات لترقیم برمز يتوافق نس مع شکلها‎ Aie 
O عن نهية جملة مثل النقطة‎ ÅA فعلامات الأرقيم التي‎ das الإنجليزيّة بهذا‎ 
A.F) C.) "Tr مز جميعها بنقطة؛ لتصبح‎ 6 mU التعجب‎ ise (fF) الفاصلة‎ 
(1) Kulick, S. (2010). Simultaneous Tokenization and Part-of-Speech Tagging for Arabic 


without a Morphological Analyzer. Proceedings of the ACL 2010 Conference Short Papers. 
Uppsala, Sweden. 


(2) Habash , N. (2010). Ibid. P.82. 


sey د‎ 


هذه الطبعة 

إهداء من المركز 

ولایسمح بد شرها ورقياً 
أو تداولها تجارياً 


cC !(‏ أما علامات الترقيم النقطتان الرأسيّتان (C)‏ الشَّرطة(-)» الفاصلة المنقوطة )€( 
رم nut Jp‏ بنقطتین راس ليع or cC DEED: UI‏ علامات eA‏ 
PST‏ رمز بالعلامة نفسها مثل الفاصلة 0 ۰ علامة التصيص (” C‏ القَوّس 
(Oso‏ القوس الشمال(()). 


© إضافة الفئة الفرعيّة (اسم عدد/ كمية (NOUN. QUANT‏ قسم الأساء. 


i5 JI و( الأعداد‎ (ADI. COMP (الصّفة القارنة‎ Ée al إضافة الفئات‎ e 
في قسم الصّفات.‎ (ADJ NUM الوصفيّة‎ 


* تمييز أداة الإشارة والتّعريف بالدَّمْرَيْنَ (DT) (DEM)‏ على «gll‏ حيث كانا 
يَرَمّرَانٍ في فئة بييز برمز واحد DT‏ وفي حالة الفصل فقط. 

0 ومن e‏ ظهور علامة DT‏ مجاورة لبعض السّمات المركبة مثال ذلك: ال+اسم 
21+17 و ال+صفة مقارنة ADJ COMP+DT‏ و ال+ عدد :DT+CD‏ و ال+صفة 
.DT+JJ‏ 

Lue y‏ يصل كاليك بعدد السات التى انتهجها بالاضافة لفئة بييز إلى 4۳ سمة» 
وقد استخدمث في Xe‏ بنك بنسلفانیا العريي الإصدار الثالث بهدف المقارنة التي يتم 
بِمّوجبها اكتشاف مو اخ ضع التقصير ÉS‏ المعالجة. "E‏ 


۱۰-۲ الفئة الكلامية للنص القر The Quranic Text Tag set | j‏ 
بدأ الاعتناء بقضایا معالحة اللّغة العربيّة OTT‏ في مطلع القرن الحادي والعشرین؛ 
pue‏ اقتصاد en Ed an nr u à e‏ بدوره ~ PA‏ 


PT isis m الطبيعيّة بجامعة‎ er TM رم فتولی فریق‎ 


با 


(1) Habash , N. (2010). Ibid. P.82. 


حدق 1 وت 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


الاب اللخرية للقرآن الکریم التي آسهمت في تطویر آلیّات ایب في نصوص القرآن 
الكريم» مثال ذلك موقع «قرآني» الذي يتيح البحث في حيثيات الفاهیم C. ST I‏ 
وقد لاقت فكرة gi M‏ القرآني نجاحًا في تطبيقهاء الآمر الذي أذى إل التفکیر فى 
تدشين مدونةٍ a‏ للقرآن الكريم على الشّبكة العنكبوتيّة تتضمن اباك لخر 
de‏ الستوی الضَرفٌ والأجزاء الكلاميّة للنصوص القرآنيّة: “» وقد انطلقت المدونة 
oa‏ في صورة dua Jit‏ لألفاظ القرآن الكريم في إطار هذه المعلومات ill‏ 
التي ماه حتى تستقطب العديد م يَنْشِدُونَ تعلم لّغة القرآن الكريم من غير 
التاطقين باه وكذلك الباحثين في علوم اللّغة العربيّة؛ للبحث في معطيات التوصيف 
اللغوي لِلنص GU‏ 

وقد ارتکزت العلومات Laus y ial‏ ضّة الأقسام الكلاميّة ا متضمنة في تلك المدوّنة 
القرآنيّة عل از اتتقليديّ -لارتباطه adu‏ القرآنن- حیث ارتبطت بالصادر 
النّحويّة به القديمة التي dl‏ منها أصوله ومصطلحاته» فكان ذلك أمرًا له بالغ الأثرء إذ 
ساعد اللسانیین عل D i os ell e‏ بسهولة ویسر لا تتيحه هذه المصادر من 
شواهد وإعراب لنصوص القرآن الکریم. 

ولا كانت الغاية من الفتة الكلاميّة أن تراعي E‏ التفصيلات النّحويّة؛ تتناسب 
EN‏ ذلك أن ؛ ER‏ يقسّموا الأقسام الكلامية d]‏ ثلائة آقسا 
ريسي تضتنا تسعة أقسام فرعي P‏ جعلوا تحت کل قسم فرعي Lal‏ أخرى... 
وبهذا تشتمل الفئة الكلاميّة على EY‏ سمة"» یوضخها الجدول رقم ۲۰: 


(1) Sharaf, A. & Atwell, E. & Dukes, K. and Others. (2010). Arabic and Quranic 
computational linguistics projects at the University of Leeds. In Proceedings of the workshop 
of Increasing Arabic Contents on the Web, organized by Arab League Educational, Cultural 
and Scientific Organization (ALECSO). 

(2) Sharaf, A. & Atwell, E. & Dukes, K. and Others. (2010).Ibid. 

(3) Dukes, K. & Buckwalter, T. (2010 ). A Dependency Treebank of the Quran using 
Traditional Arabic Grammar. 7th international conference on Informatics and Systems. Cairo, 


Egypt. 


e ( 12 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


PN Proper noun اسم علم‎ 
IMPN Imperative verbal noun اسم فعل آمر‎ 
الضمير‎ 
PRON Personal pronoun الاسم ضمير‎ 
DEM Demonstative pronoun اسم إشارة‎ 
REL Relative pronoun اسم موصول‎ 
الصفة‎ 
ADJ Adjective صفة‎ 
NUM Number ر قم‎ 
الظرف‎ 
T Time adverb الاسم ظرف زمان‎ 
LOC Location adverb ظرف مکان‎ 
فعل‎ » 
V Verb فعل‎ p 
حرف‎ 
P Preposition حرف جر‎ 
اللام -السوابق‎ . 
الاداة‎ 
EMPH Emphatic làm prefix لام التوكيد‎ 
IMPV Imperative lám prefix لام الأمر‎ 
PRP Purpose làm prefix لام التعلیل‎ 


eye 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


الاداة 


الاداة 


آداة استدراك 


آداة جواب 


أداة استثناء 
أداة استقبال 
حرف ابتداء 
حرف استفهام 
جر ان 
حرف کاف 
T ims d‏ 
حرف استئناف 
أداة حصر 
حرف إضراب 


حرف زائد 


Coordinating conjunction 


Subordinating conjunction 
الأدوات‎ 
Accusative particle 
Amendment particle 
Answer particle 
Aversion particle 
Particle of cause 
Particle of certainty 
Conditional particle 
Equalization particle 
Exhortation particle 
Exceptive particle 
Exceptive particle 
Future particle 
Inceptive particle 
Interrogative particle 
Negative particle 
Preventive particle 
Prohibition particle 
Resumption particle 
Restriction particle 
Retraction particle 


Supplemental particle 


2 


CONJ 
SUB 


ACC 
AMD 

ANS 

AVR 
CAUS 
CERT 
COND 


هذه الطبعة 
إهداء من المركز 


ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


حرف فجأة 


حرف نداء 


حروف مقطعة 


Surprise particle 
Vocative particle 
حروف مقطعة‎ 


Quranic initials 


الجدول: ۲۰ الفتة الكلامية للنص القرآني O‏ 


یلاحظ أن الادوات قد تالت التصيب الاکبر في الفئة الكلاميّة؛ لتعدّد معانيها نی 
القرآن الکریم» ولأهميّتها في سياق ال GL‏ بوصفها مک CUI‏ حدید دلالة 
کیب الق رآ وني القابل نجد الفعل أقل حظا في تلك الفئة الكلاميّة» حيث ل تتعرّض 
لأنواع الفعل من حيث دلالاته على الرّمن أو احدث. إلا del‏ يغفلوا - أي فريق معالجحة 
اللغة الطبيعية - عن ذلك» فقد أوضحوا تقسيمات الفعل والفصائل النحويّة التى تحملها 
الأقسام الكلاميّة في التحليل التفصیلع للكلمة بعيدًا عن التحليل الجمل JA.‏ القرآنيّة 


SUR 
VOC 


INL 


كما ورد في الجدول السابق» ومن Las‏ يذكروا تلك التفصيلات في الفتة الكلاميّة 


ويعرض الشّكل رقم ۲۳ الأقسام الكلاميّة 


o‏ م 


م ast‏ الفرآية Gg di‏ برشل شن 


ONE EE القرآنيّة التي‎ SAM القتبسة من‎ CUS 


v - Jra person masculine singular Gorm X) passive perfect verd 


قعل ماض مني للمجهول 


P - preted preposibon oi 
N - gentve masculine plural éndefinte noun 


جار ومجرور 


جع P-‏ 
حرف جر 


H- gene noun 
PRON - 2nd person masculine singular possesaive pecen 
متصل ي محل جر بالااضاة‎ eet اسم مجرور والکاف‎ 


الشکل:۲۳ جملة قرآنية معنونة بالأقسام الکلامية-سورة الأنعام آية mg‏ 


Transásbon. Arabic word. 
ووداو‎ Ld و‎ 5 
۵9 CERT EMPH REM 

were mocked. 2 
10 12^ 
Messengers ۷ P 
from È 
IE 
qatara - 
before you PRON N 


(1) Dukes, K. & Buckwalter, T. (2010 ).Ibid. 
(2) Quran Syntax. (2009). http://corpus.quran.com/treebank.jsp 


2á Ys 


هذه | لطبعة 


اهداء من الرکز 
ولایسمح بنشرها ورقياً 
أو تداولها تجارياً 
ویتضح من عَنْوَنة الجملة القرآنيّة بقة أن تلك العَنوّنة خی d‏ البصرية 


Ab في تحديد الأقسام کیت علارة عل تمين كل سم کی بلود‎ LS 
للناطقين بها أو‎ X وهذا من المکن أن ي يسهم في تعليم اللّغة العربيّة‎ Ñ DI في الوحدة‎ 
ار اوسني‎ d الي لكل‎ QR pe coe هد يعد أن‎ 
pex ob uotis مسلمة‎ di de der o" القام | أن أذكر ما خلص إليه‎ 
دا أن العربيّة لغة قديمة باليقه وعاجزة عن‎ ME خاطنًا آوشك أن‎ 
الحديثة».‎ deo VI الجالات‎ e^ مواكبة التطوّر في‎ 

SALMA Tag set الکلامية‎ iala فئة‎ Ye 

قدم الدكتور مجدي صوالحة ضمن أطروحته للدكتوراة التي أعدها بجامعة ليدز فئة 
كلامية تنطلق من السات الصرفية الخالصة للغة العربية» بغرض بناء معنون لأقسام 
الكلام» يسهم في عنونة المدونات اللغوية بالعلومات الصرفية لكل كلمة. O‏ 

وبلغ عدد فئات السمات الصرفية ۲۲ فئة» مستندًا في تغطيتها على الكتب التراثية 
العربية» بحيث تغطي السمات الصرفية العربية الخالصة التي لا يشوبها تأثر باللغة 
الإنجليزية ىا ظهر في العديد من الفئات الكلامية الأخرى. € 

وتنم العنونة في صور متجهات متتالية» تشغل كل فئة موقعها في المتجه المحدد سابقاء 
وذلك بغرض المحاذاة التي تقتضیها تقنیات الذکاء الا صطناعي. ویوضح الشكل رقم 
Y E‏ مثالا معنونا بفثة صوا حة الكلامية للآية القرآنية ” وَوَصَّيْما الانسان Us‏ إِحْسَانًا“. 


Word Morphemes Ta 
پر‎ j "a And p-9-———-———— مح ع ع ع عع ص‎ 
And Wiehe WP > 2 مین چ‎ wasay Have enjoined v-p---mpfs-s-amohvtt&- 
T 73 o ond We r---r-xpfs-s----hn---- 
al-"insdna فل <- - تسا‎ a The سوه وه هو و‎ 
oO مد وی ` هده‎ man nq----ms-pafd---htbt-s 
bi-wülidayh qy -p ب‎ 56 To ۳۰۳۳ 
His parents SICA a "wdlida Parents nu----md-vgki---htot-s 
Na yy Both r---r-xdts-s---------- 
34 ه‎ hi His r---r-msts-k---------- 
husn” E - - خسن چ‎ hum kindness ng----ms-vafi---ndst-s 
Kindne *-A - r---k------ f---------- 


الشكل ۲٤٠:‏ مثال معنون بفئة سلمة الکلامیة(؟) 


A (نبيل):اللغة العربية واحاسوب» ص‎ de OD) 
(2) Sawalha, M. (2011). Ibid. ۰ 
(3) Sawalha, M. (2011). Ibid. P.123. 
(4) Sawalha, M. (2011). Ibid. P.124. 


im 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


ويوضح الجدول رقم ۲۱ فئات سلمة الكلامية التي تتكون من ۲۲ سمة صرفية: 


Morphological Features Categories 
REGN Main Part-of-Speech 'aqsám al-kalàm ar-ra 'isiyya 
Part-of-Speech: Noun | ام هکم هرم س‎ [n al-kalàm al-far'iyya' (al. 
"ism) 
5 


3 Part-of-Speech: Verb 


harf) 


l'aqsám al-kalám al-far'ivya' ("uhrà)‏ أقسام الكلام الفرعيّة راحری) 
al-kalám al-far'iyya'‏ 71 أقسام الکلام الفرعيّة (علامات 
"n" 'alámát at-tarqim)‏ 


Inflectional morphology 


Case or Mood 
su علامة الإعراب أو‎ ['alamát al-'i*rüb wa 0 


[75 [oen —— لت‎ 
14 Voice dini اي للنفلوم و المي‎ l-mabni lil-ma'lüm wa ۵۸ 
il-maghül 
15 Emphasized and non- اليؤكد وغیز النؤكد‎ Jal-mu'akkad wa gayr al-mu'akkad 
emphasized 


MLAKI فئة سلمة‎ Y Vd sad 


Y‏ عنونة الدونة اللغوية - عينة الدراسة - بالأقسام الكلامية 

ولا كان البناء الشجري النحوي یقتضی تحلیل العلاقات التركيبية في آبنية الجمل» 
فان من البدیهی أن ینطلق التحلیل nds‏ الأجزاء الكلامية لتلك الأبنية التی تعد 
من آهم الدخلات الابتدائية لاي عملية تحلیل نحوي/ کی ۱ 

وسعيًا إلى توفیر أو تصمیم فئة للأجزاء الكلامية يُعتمد علیها في عنونة المدونة اللغوية عينة 
الدراسة» تقترح الدراسة أن تسير على فئة (آر دي آي) للأنواع الكلامية مع الإضافة والحذف 
لبعض السمات. وقد تم الاعتاد على هذه الفئة الكلامية - دون غيرها - لأسباب منها: 


(1) Sawalha, M. (2011). Ibid. P.126. 


eye 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


* تستوعب هذه الفئة طبيعة الكلمة التركيبية؛ لأنها تقوم على التجهات الكلامية 
eM‏ الكلمة. 


© تنبثق من أصول النحو العربي» بعکس العدید من الفئات العربية النبثقة من فئات 
اللغة الا نجليزية. 


© التقاژها مع ما تبدف إليه الدراسة» حيث تم توظیفها لاستنباط علامات الضبط 
للعربية الکتوبة غير الشکولة» وهو ما یناط به التحلیل النحوي. 

وانطلاقا ما تسعی إليه الدراست فقد اقترحت الدراسة سمتین اضافیتین للفئة 
الكلامية مع حذف آربع سات منهاء آما السیات التي آضیفت إلى الفئة الكلامية فهي 
"علامة الترقيم“ » و“العدد“ ؛ لا فا من دور تأثيري في الاستدلال على العلاقات 
التركيبية. بینا السیات التى حذفت من الفئة الكلامية هى سمتا بداية الكلمة SOW‏ 
والحشو Padding‏ اللتان deed eb.‏ اع الات اللغو ية على التدريب أثناء بناء 
معنون (آر دي آي) للأجزاء الكلامية السمّی ب (الشسّراج) ۰ وسمتا الزوائد النحوية 
”همزة الاستفهام" و“ضمير النصب أو الجر“ اللتان كانتا يعنيان بزوائد الكلمة 
اللصقية. 

وقد استعانت الدراسة بمعنون السراج للأجزاء الكلامية”" باعتبارها آداة مساعدة؛ 
لعنونة نصوص المدونة اللغوية بالأجزاء الكلامية GT‏ ثم مراجعة المخرج يدويًا مع 
إضافة بعض التعديلات التي تتفق واحدف المنشود من البناء. 

ومن أمثلة حرجات الآلية التى يستند إليها البحث في عنونة الأجزاء الكلامية هذه 
debant catal cad edt d‏ ات اشر لان عت عل 
سحبها من جميع حافظات مصرء وجميع ها ظهر بها الادة الملوثة. و شارت الباحثة ب 
قسم الکیمیاء الحيوية ب هيئة الرقابة و البحوث الدوائية المصرية» أن ه على الرغم من 
حساسية الضعيفة ل الأجهزة الوجودة داخل الهيئة» ف إن النتائج كل ها جاءت تؤكد 
وجود الكلورامفينيكول في /٠٠١‏ من عينات العسل." إسلام أون لاين- ۲۰۰۸ م 


)١(‏ المعنون النحوي للمفرادات العربية» للاطلاع والتجریب» يمكن زيارة موقع (آر دي آي). 
(Y)‏ قد تعدت نسبة دقته ۸٩7‏ من خلال فحص عينة من ۱۰۰۰ كلمة. 


-\ YY- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


(NullPrefix) 1 (Active) 12 (Verb) 37 (Past) 39 (Femin) 8‏ :(فحصت)) 
(Single) 51) ((.3; (NullPrefix) 1 (Active) 12 (Verb) 37 (Preslmperat) 40‏ 
:(الشریف)) }46 (NullSuffix) 46). ((—3:5); (NullPrefix) 1 (Noun) 14 (NullSuffix)‏ 
(NullPrefix) 1‏ :(ئلائین)) )46 (Definit) 7 (Noun) 14 (ExaggAdj) 18 (NullSuffix)‏ 
(Noun) 14 (Plural) 42 (Masc) 50 (NonAdjunct) 54 (MANSS MAGR) 55]‏ 
(NullPrefix) 1 (Noun) 14 (ExaggAdj) 18 (Femin) 48 (Single) 51}‏ :(عينة)) 
(NullPrefix) 1 (Noun) 14 (NullSuffix) 46) «((8); (NullPrefix) 1‏ :(عسل)) 
(NullPrefix) 1‏ :(سحبها)) )46 (Active) 12 (Verb) 37 (Past) 39 (NullSuffix)‏ 
(Noun) 14 (ObjPossPro) 57) {(ûa); (NullPrefix) 1 (Prepos) 5 (NullSuffix)‏ 
(NullPrefix) 1 (Noun) 14 (ExaggAdj) 18 (NullSuffix) 46)‏ ((جميع)) )46 
 (NullPrefix) 1 (Noun) 14 (Plural) 42 (Femin) 48) ((0—4);‏ ر(محافظات)) 
(Conj) 3 (Noun) 14‏ ر(وجمیعها))۰ )46 (NullPrefix) 1 (Noun) 14 (NullSuffix)‏ 
(NullPrefix) 1 (Active) 12 (Verb)‏ :(ظهر)) )57 (ExaggAdj) 18 (ObjPossPro)‏ 
(Past) 39 (NullSuffix) 46) ((&); (NullPrefix) 1 (PrepPronComp) 2‏ 37 
(NullSuffix) 46) (5349); (Definit) 7 (Noun) 14 (SubjNoun) 17 (Femin) 48‏ 
(Single) 51) (354); (Definit) 7 (Noun) 14 (SubjNoun) 17 (Femin) 48‏ 
(Conj) 3 (Active) 12 (Verb) 37 (Past) 39 (Femin) 48‏ ز(وآشارت))۰ )51 (Single)‏ 
(Definit) 7 (Noun) 14 (SubjNoun) 17 (Femin) 48‏ :ر(الباحثة)) )51 (Single)‏ 
(الکیمیاء)) }46 (Single) 51) ((&-à); (Prepos) 5 (Noun) 14 (NullSuffix)‏ 
(Definit) 7‏ :(الحيوية)) )46 (Definit) 7 (Noun) 14 (NoSARF) 21 (NullSuffix)‏ 
(Prepos) 5 (Noun)‏ :(بهیت)) )51 (Noun) 14 (RelAdj) 47 (Femin) 48 (Single)‏ 
(Definit) 7 (Noun) 14 (Nounlnfinit) 15‏ :(الرقابة)) )51 (Femin) 48 (Single)‏ 14 
(Conj) 3 (Definit) 7 (Noun) 14‏ (والبحوت)) )51 (Femin) 48 (Single)‏ 
(NullSuffix) 46} ((&5 53); (Definit) 7 (Noun) 14 (Nounlnfinit) 15 (RelAdj)‏ 
(Definit) 7 (Noun) 14 (RelAdj) 47‏ (المصریغ) )51 (Femin) 48 (Single)‏ 47 
(Femin) 48 (Single) 51) «((43); (NullPrefix) 1 (ParticleNAASIKH) 34‏ 
:(الرغم)) )46 (NullPrefix) 1 (Prepos) 5 (NullSuffix)‏ _ ررعلی)) )57 (ObjPossPro)‏ 
(Definit) 7 (Noun) 14 (NullSuffix) 46) {(ûa); (NullPrefix) 1 (Prepos) 5‏ 
(Definit) 7 (Noun) 14 (Nounlnfinit) 38 (Femin)‏ :(الحساسية)) )46 (NullSuffix)‏ 
(Definit) 7 (Noun) 14 (ExaggAdj) 18 (Femin) 48‏ :(الضعيفة)) )51 (Single)‏ 48 
(Prepos) 5 (Definit) 7 (Noun) 14 (Plural) 42 (Femin)‏ ز(للأجهزة)) )51 (Single)‏ 
(Definit) 7 (Noun) 14 (ObjNoun) 19 (Femin) 48‏ :(الموجودة)) )51 (Single)‏ 48 
(NullPrefix) 1 (Noun) 14 (SubjNoun) 17 (NullSuffix)‏ :(داخل)) )51 (Single)‏ 
(Conj) 3‏ :(فان))۰ )51 (Definit) 7 (Noun) 14 (Femin) 48 (Single)‏ :(الهيئة)) )46 
(ParticleNAASIKH) 34 (NullSuffix) 46) ((c333); (Definit) 7 (Noun) 14‏ 
(NoSARF) 21 (Plural) 42 (NullSuffix) 46) ((t&S); (NullPrefix) 1 (Noun) 14‏ 
(NullPrefix) 1 (Active) 12 (Verb) 37 (Past) 39‏ ر(جاعت)) )57 (ObjPossPro)‏ 
(Femin) 48 (Single) 51) ((:$5); (Present) 10 (Active) 12 (Verb) 37‏ 
(NullSuffix) 46) ((2:»s3;  (NullPrefix) 1 (Noun) 14 (NullSuffix) 46}‏ 
59M); (Translit) 61) (3); (NullPrefix) 1 (Prepos) 5 (NullSuffix)‏ امفینیکو)) 
:(عینات)) )46 {(jûa); (NullPrefix) 1 (Prepos) 5 (NullSuffix)‏ 10096 )46 
:(العسل)) )48 (NullPrefix) 1 (Noun) 14 (ExaggAdi) 18 (Plural) 42 (Femin)‏ 
(Definit) 7 (Noun) 14 (NullSuffix) 46}.‏ 


شکل Yo:‏ رجات آلية السر اج للعنونة الكلامية 


Y= 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


Lad y‏ للغاية المنشودة من الدراسة: فکان لابد من تناول يعض الانجرامات العملية 
- التضمنة الحذف والزيادة في سات الفئة الکلامية - على رجات هذه الالية: 

* مراجعة الجزاء الكلامية لفردات الدونة اللغوية د العنونة آلا - وتصحیحها 
من الناحية اللغوية. 

© زالة الأرقام التي تجاور کل سمة من السیات الكلامية كا في JUL‏ السابق؛ لأنها 
ببساطة هي جرد تعبیر عن مورفییات آجزاء الکلام» آلزمت کل نوع كلامي للتوازي 
بين مورفیات الحلل الصرفي (الیزان) ومورفیات الأجزاء الكلامية آثناء تصمیم 
العنون الآلي السراج؛ ولذلك لم يكن لوجودها فائدة في بنائنا النحوي. 

e‏ ولا كانت الفئة الكلامية الستخدمة في الدراسة التي بنتهجها العنون الكلامي تقوم 
على النص غير الجزی» فکان لابد من إجراء بعض التعدیلات علیها والتی تمثلت في 
إدماج سمتي «الهمزة الاستفهامية» و»الآداة الاستفهامية» في سمة واحدة تاش هنا وجلة 
نحوية واحدة» وحذف سمة D‏ ضمير نصب أو جر التى كان مردها المورفيات اللصقية. 

e‏ ولا كانت نصوص الدونة اللغوية المجرأة ستکون دخا للمحلل التحوي 
Stanford Parser‏ - الستخدم في الدراسة الذي یتضمن e‏ للأقسام الكلاميةء 
فکانت المعالجة اليدوية لخرجات العنون الکلامی من حيث فصل الزوائد منها خبر 
سبیل لحل هذه العضلة» ومن ثم المقابلة بالتوازي cob So Mapping‏ العنونة التي 
تم تعديلها وخرجات عنونة الأجزاء الكلامية للمحلل النحوي. 

وجدير بالذكر بأنه قد تم تطوير أداة برمجية - من قبل الباحث - لإجراء هذه المطابقة 
es OTT‏ إزالة الأقواس التي تحيط كل جزء كلامي ثم إضافة علامة الجمع ”+“ بين هذه 
الأجزاء الكلامية. ويوضح الشكل التالي شفرة «کود» الأداة المكتوبة بلغة بايثون البرمجية: 


جع ۲ اب 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


#!/usr/bin/python 
#coding=utf-8 
import sys 

import re 

import codecs 


def cleanAndArrangeLine (line): 
newWord= «< (< 


line = line.strip() 
line = line[1:-1] 
words = line.split(« <) 


isEntered = True 
for word in words[1:-1]: 
if word is > ۶ 
continue 
if isEntered: 
newWord = newWord-*»»-tword 
isEntered = False 
else: 


newWord = newWord-*»-t»-t*word 
newWord = newWord-*» «-c*words[0]-»)» 
print newWord 
return newWord 


def getTreeFromLine(line): 
tree = (); 
lines = re.findall(«N(.*?M) »,line.strip()); 
for line in lines: 
word = line.split(« «)[0][1:].strip(O). 
replace (< 5, >>).replace (< >, >>) .replace (< >, >>) 
replace (< $, >>).replace (< >, >>).replace (< 5, >>) 
replace («5,»»).replace(«5,»»).replace(«!«,«]0»). 
replace(«!«,«1») .replace(«!«,«T») .strip() 
line = cleanAndArrangeLine (line) 
tree[word] = line.strip() 
return tree 


treeFilePath = sys.argv[1] 
textFilePath = sys.argv[2] 
outputFilePath - sys.argv[3] 


treeFile = open(treeFilePath,o»r») 

textFile = open (textFilePath, >r >) 

textFileLines = textFile.readlines() 

treeFileLines = treeFile.readlines() 

outputFile = codecs.open(outputFilePath, »w»,encoding-»u 
tf-8») 


حدق ۲ 3ت 


هذه | لطبعة 


إهداء من الرکز 
ولایسمح بنشرها ورقياً 
أو تداولها تجارياً 
count > 0‏ 
for line in textFileLines:‏ 
line = line.replace(« («,»»).replace(«)»,»»).‏ 
replace (<; >, >>) .replace (<\»>, >>)‏ 
line = line.replace (< {<, <)> ( .replace (<} >, >) >)‏ 
tree = getTreeFromLine(line)‏ 
lineOfTree = unicode(treeFileLines[count],o»utf-8»)‏ 
lineOfTr = lineOfTr lesen]‏ 


for key in tree: 
key1 = unicode (key, »utf-8»>) 
keyl = keyl[::-1] 
replacement = unicode (tree[key],»utf-8»)[::- 
1]; 
lineOfTree = re.sub(«WV)»tkeylt».*?N 
(<, replacement,lineOfTree) 
count = count + 1; 
lineOfTr = lineOfTr ET] 
outputFile.write(lineOfTreet»Nn»); 


treeFile.close() 


textFile.close() 
outputFile.close() 


وبتطبیق الاجراءات العملية السابقة على خر جات العنونة الآلية» یظهر المغال السابق 
بهذا الشکل رقم Y‏ 


2۱۲ 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقياً 
أو تداولها تجاریا 


(NullPrefix-Active- Verb*Past«Femin-Single (قحصت‎ (NullPrefix*Noun-NullSuffix ).د‎ 
(NullPrefixNoun--NullSuffix 3 5) (Definit»Noun-ExaggAdj*NullSuffix (الشریفب‎ 
(NullPrefixeNoun-*Plural-Masc*NonAdjunct-MANSS. MAGR (ثلاثين‎ 
(NullPrefix-«-Noun-ExaggAdj*Femin-*Single Aie) (NullPrefix-Noun-*NullSuffix (عسلٍ‎ (PUNC 
,) (NullPrefix-Active* Verb Past NullSuffix a3) (NullPrefixeNoun-NullSuffix $) 
(NullPrefix*Noun-*Pronoun-NullSuffix &) (NullPrefix-Prepos--NullSuffix 5) 
(NullPrefix-Noun-ExaggAdj-NullSuffix (جمیع‎ (NullPrefix+Noun+Plural+Femin (ممحافظات‎ 
(NullPrefix*Noun-NullSuffix »—4) (PUNC <) (NullPrefixsConj-*NullSuffix s) 
(NullPrefix-Noun-ExaggAdj*NullSuffix (جمیع‎ (NullPrefixeNoun*Pronoun-NullSuffix t) 
(NullPrefix+Active+Verb+Past+NullSuffix |. »e&) (NullPrefixPrpPronComp-NullSuffix (بها‎ 
(Definit-Noun*SubjNoun*Femin-Single ll) (Definit«Noun*SubjNoun*Femin^Single 
áa skii) (PUNC .( 

(NullPrefix+Conj+NullSuffix 5) (NullPrefix+Active+Verb+Past+Femin+Single (آشارت‎ 
(Definit+Noun+SubjNoun+Femin+Single (الباحجثة‎ (NufPrefixePrepos)NultSuifix (ب‎ 
(NullPrefixx-Noun-NullSuffix ei) (Definit«Noun-NoSARF«NullSuffix (الکیمیاء‎ 
(Definit-Noun-RelAdj*Femin-Single (الحيويّة‎ (NullPrefix-Prepos--NullSuffix (ب‎ 
(NullPrefix-Noun-Femin-Single 33) (Definit-Noun*Nounlnfinit-Femin-*Single (الرّقابة‎ 
(NullPrefix»Conj*NullSuffix s) (Definit-Noun-*NullSuffix ei Adi) 
(Definit-Noun*Nounlnfinit-RelAdj*Femin-Single A3! 53lI) 
(Definit-Noun-RelAdj*Femin*Single (الْمِصْريّة‎ (PUNC ;) 
(NullPrefix*ParticleNAASIKH-NullSuffix ó!) (NullPrefixeNoun*PronounsNullSuffix °) 
(NullPrefix«Prepos*NullSuffix (علی‎ (Definit«Noun-*NullSuffix aè“) 
(NullPrefix-Prepos*NullSuffix (من‎ (Definit-Noun*Nouninfinit-Femin-*Single (الحساسية‎ 
(Definit-Noun*ExaggAdj*Femin-Single (الضّعيفة‎ (NullPrefixePrepos-NullSuffix J) 
(Definit-Noun-Plural-Femin-Single (الاجُهزة‎ (Definit-Noun*ObjNoun-Femin-Single 
(المؤجُودة‎ (NullPrefixeNoun-*SubjNoun-NullSuffix (داخل‎ (Definit-Noun*Femin-Single Agli) 
(PUNC ,) (NullPrefix»Conj*NullSuffix —) (NullPrefix*ParticleNAASIKH--NullSuffix čl) 
(Definit-Noun-NoSARF-Plural-NullSuffix z) (NullPrefixNoun-NullSuffix 13 
(NullPrefix-Noun-*Pronoun-*NullSuffix رها‎ (NullPrefix-Active-Verb-*Past-Femin-Single 
(جاءث‎ (Present+Active+Verb+NullSuffix 3$ 5) (NullPrefixeNoun-*NullSuffix » 55 5) (Translit 
iial y il) (NullPrefix+Prepos+NullSuffix (في‎ (NullPrefix+CardNumber+NullSuffix 10096) 
(NullPrefix+Prepos+NulISuffix_CON 3) (NullPrefix-Noun-ExaggAdj*Plural-Femin (عیتات‎ 
(Definit-Noun-NullSuffix dal) (PUNC  .) 


شکل:۲ رجات آلية السراج للعنونة الكلامية بعد تطبیق الإجراءات العملية 
وبملاحظة الثال السابق يتبين مواضع الاختلاف بين العنونة الآلية والاجراءات 
با ا 
ات كار e‏ ا eu e‏ کل حرف 
e‏ عنونة علامات الترقيم والأعداد اللتين يتجاهلها العنون الآلي. 
٠‏ عنونة الزوائد النحوية منفردة» حيث كانت متصلة بالمفردات في العنونة الآلية. 
« عنونة الضمائر المجزأة التي تكون في حكم الاتصال بعلامة „Pronoun‏ 


(۲ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 
bey‏ آقسام الكلام Part Of Speech (POS)‏ 
بعد الاجراءات العملية التى تمت على الفثة الكلامية الستخدمة في إطار تحقیق 
الحدف المنشود من الدراسة» تمثلت الفئة الكلامية بعد إعادة هيكلتها - من ناحية توزيع 
الأقسام الكلامية الرئيسية وعدد سماتها - في ستة أقسام رئيسية ( الاسم - الفعل - 
الأداة - الظرف - الكلمة الأجنبية - علامة الترقيم) تتخللها ”0 سمة. 


الاسم 
اسم Noun Nominal‏ 
Nouns made of infini-‏ ۲ 
مصدر . Nounlnfinit‏ 
tives‏ 
اسم مصدر NounInfinitLike NounInfinit" like"‏ 
اسم فاعل SubjNoun Subject noun‏ 
صيغة مبالغة ExaggAdj Exaggeration adjective‏ 
الاسم اسم مفعول ObjNoun Object noun‏ 
Noun of time or loca- 3‏ : 
اسم زمان أو مکان . TimeLocNoun‏ 
tion‏ 
الضمير Pronoun pronoun‏ 
و 
ضمیر ر فع SubjPro Subject form pronoun‏ 
اسم موصول RelPro Relative pronoun‏ 
Demonstrative pro-‏ 
اسم إشارة DemoPro‏ 
noun‏ 
العدد CD Cardinal number‏ 


-\ ۲ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


خصائص الاسم الصرف-نحوية 
NullPrefi Null prefi pla‏ 
"T‏ لا سابق ullPrefix ull prefix‏ 
zol 4UI‏ 
deep‏ لا لاحق NullSuffix Null suffix‏ 
علامات منوع من An Arabic feature of a‏ 
NoSARF .‏ 
الصرف الصرف specific class of nouns‏ 
علاما 1 1 . 
p‏ ال التعریف Definit Definitive article‏ 
التعريف ١‏ 
F * 1 E Ass‏ ۰ 
علامات تانيث Femin eminine‏ 
p‏ 
: مذکر Masc Masculine‏ 
NI‏ 
E‏ مفرد Single Singular‏ 
علامات pi‏ 5 
1na p‏ 
العدد Tum ii ili‏ 
Plural Plural c^‏ 
Relative adjectives‏ : 
نسب RelAdj‏ 
maker `‏ 
علامات 
للدلالة مضاف Adjunct Adjunct‏ 
غير مضاف NonAdjunct NonAdjunct‏ 
علامات . Nn Ist Arabic syntactic‏ 
الإعراب case e‏ 


siyi 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


-— 


یر 
الاعراب جرور 
2457 


فعل 


m‏ الفعل اللازم 
= الفعل التعدي 


مبني للمعلوم (للفاعل) 
مبني للمجهول (للمفعول) 


الفعل الناسخ 


2nd Arabic syntactic 


case 


2nd or 3rd Arabic 


syntactic case 


3rd Arabic syntactic 


case 
فعل‎ 
Verb 


Transitive verb 


InTransitive verb 


Active sound 
Passive sound 


A class of auxiliary 
verbs that make the 
predicate of the conse- 
quent verbal sentence 
in 2nd Arabic syntac- 


tic case 


teas 


MANSS 


MANSS MAGR 


MAGR 


Verb 


Transitive 


InTransitive 


Active 


Passive 


VerbNAASIKH 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


خصائص الفعل الصرف - نحوية 


NullPrefix Null prefix لا سابق‎ 
NullSuffi Null suffi. 8 
ullSuffix ull suffix لاحق‎ N mS 
اللو اصة‎ 
Present Present tense مضارع‎ e تلو‎ 
Future Future tense استقبال‎ 
Past Past tense v? ما‎ 


الزمن 


Present tense, or im- 


PresImperat . مضارع أو آمر‎ 
perative 
Imperative Imperative P 
Femin Feminine لفعل تأنيث‎ | 
احنس‎ 
Masc Masculine مذکر‎ 
Single Singular مفرد‎ 
Binary Binary T العدد‎ 
Plural Plural c^ 
MARE Ist Arabic syntactic . 
case o 
2nd Arabic syntactic 
MANSS منصوب‎ 
case : الاعرا‎ 
س ع‎ 
2nd or 4th Arabic | : ا‎ 
۱۸۱۲ 7 ۱ bi 
a syntactic case جر وم‎ 
NIAZ 4th Arabic syntactic 
case جزدم‎ 


۳ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


Prepos Preposition حرف جر‎ 


Interj Interjection حرف نداء‎ 


Preposition-Pronoun 


PrepPronCom وا‎ ju 
p p Coupe لجار والجرور‎ 
A class of particles 
that make the subject 
ParticleNAASIKH of the consequent 508 
نت‎ nominal sentence in ع‎ dd 
2nd Arabic syntactic 
case 
Conj Conjunctive العطف‎ 
Confirm Confirmation by Laam لام التوکید‎ "m 
داه‎ 
InterrogArticle InterrogArticle أداة استفهام‎ 
For specific articles 


that make the conse- 
JAAZIMA جازمة‎ 
quent verb in the 4th 


Arabic syntactic case 


dsdi NA Feature of a class of eT 
Arabic conditionals ار‎ NU 


CondNot Feature of a class of T 
JAAZIMA Arabic conditionals ان‎ 
Except Article of exception استثناء‎ 
LAATA Arabic specific article لات‎ 


cs 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


LAA Arabic specific article y 


A class of articles 
NoSyntaEffect that have no syntactic غير عاملة‎ 
effect 


Arabic specific class 


of particles that make 
ParticleNAASSIB | the consequent verb in ناصب‎ 
2nd Arabic syntactic sla Ml 
case 
MASSDARIYYA | Arabic specific article مصدرية‎ 


حصائص الأداة الصر فية 


NullPrefi Null prefi 2L 
ullPrefix ull prefix از لا سابق‎ 
اللواصق‎ 
NullSuffix Null suffix لا لاحق‎ 
Feature for certain 
DZARF ۱ ظرف‎ 
kind of Arabic adverbs 
حصائص الأداة الصرفية‎ 
NullPrefi Null prefi FIT 
ullPrefix ull prefix لا سابق‎ m 
اللو اصق‎ 
NullSuffix Null suffix لا لاحق‎ 
الکلمة‎ 
Translit Translit à e کلمة‎ A 
ransli ransli الأجنية غير عربية‎ 
Punc Punctution التر قيم التر قيم‎ 


احدول:۲۲ الفئة الكلامية بعد إعادة هيكلتها 


rs 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


سأتناول عناصر هذه الفئة الكلامية بشيء من التفصیل مبتداً بتعریف الأقسام 
الكلامية الرئيسية ( الاسمء الفعل الاداق الظرف. الكلمة الأجنبية» علامة الترقیم) ثم 
توضيح السمات التي تندرج تحت كل قسم كلامي» مبینا أوجه علاقتها بذلك القسم. 


۳ الاسم 

هو ما دل على معنى في نفسه غير مقترن بزمان: إنسان» رجل. ويتميز الاسم في 
القواعد العربية بموضعين مختلفين: أنواعه وخخصائصه. © 

۱-۱-۱-۳ أنواعه: 

۱-۱-۱-۱-۳ متصرف» يثنى ويجمع ويصغر وينسب إليه. 

۲-۱-۱-۱-۳ غير متصرف يلزم حالة واحدة. 

۱-۱-۱-۱-۳متصرف. وهو نوعان: 

۱-۱-۱-۱-۱-۳ جامد: اسم متصرف غير مأخوذ من غيره أي أنه وضع على 
صورته الحالية ابتداءً؛ فليس له صل يرجع إليه أو يتفرع منه. ويشمل اسم الذات أي 
اسمي الجنس (امرأة» رجل» عرب. آم) والعلم ( مصرء أحمد. مریم واسم المعنى أي 
المصدر المجرد )15 (Qo‏ وقد تم توصيفهم برمز الاسم Noun‏ 

۲-۱-۱-۱-۱-۳ مشتق: اسم متصرف مأخوذ من غيره» له أصل يرجع إليه 
ويتفرع منه." ويشمل الاسم المشتق: 

NounInfinint مصدر‎ © 

اسم يدل على حدث خالیّا من الدلالة على الزمن» متضمنتا آحرف فعله a‏ أو 
تقدیرّا: مثل اجتاع من الفعل اجتمع. $ 

۰ اسم مصدر NounlInfinitLike‏ 

لفظ يدل على معنی الصدر وینقص عن حروف فعله لفظا وتقدیرا دون تعویض 


(۱) الدحداح (انطوان): في لغة النحو العربي» ص ۰۱۵ 
CY)‏ الصدر السابق» ص M‏ 
(۳) الصدر qx Ul‏ ص ۰۲۷ 
C£)‏ الصدر السابق» ص ££ 


is‏ ]بت 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


هذا من ناحية اللفظ آما من ناحية المعنى فهو ما تعلق بالأثر المترتب على الفعل. JU‏ 
اسم المصدر عطاء للفعل آعطی (. 

»اسم فاعل SubjNoun‏ 

اسم مشتق يدل على الحدث وفاعله. مثال اسم الفاعل طاعن للفعل O, yab‏ 

ExaggAdj صيغة مبالغة‎ e 

اسم مشتق بمعنى اسم الفاعل يدل على زيادة الوصف في الموصوف. مثال صيغة 
المبالغة حذر» خبير. ۲ 

»اسم مفعول ObjNoun‏ 

اسم مشتق يدل على ما وقع عليه الفعل. مثال اسم الفعول مسؤول» مغلق.* 

اسم زمان أو مكان TimeLocNoun‏ 

اسم مشتق يدل على وقت وقوع الفعل أو موضعه. مثال اسم الزمان أو الکان 
jn‏ بن فرعي 

۲-۱-۱-۱-۳ غير متصرف» ويشمل: 

* الضمير 

pronoun الضمير‎ © 

هو الضمير الذي يكون في حكم الاتصال بآخر الكلمة قبل تجزئة الوحدات الفرعية 
مثل: ضمير الجر أو النصب. 

SubjPro ضمير رفع‎ e 

هو ضمير بارز» alt‏ من الاعراب الرفع مطلقا. مثال ذلك الضمير المنفصل: هو 
أنت» أناء والضمير المتصل: التاء النون الواوء الألف. € 

»اسم موصول RelPro‏ 

اسم يدل على معيّن» ولا يتم معناه إلا بجملة تذكر بعده تسمى صلة الوصول أو 
الجملة المكملة للجملة الكبرى. مثال ذلك الموصول الخاص الذي له صيغ للمذكر 


(۱) المصدر السابق» ص ۲۸ 

.۲۳۸ ص‎ Y دار العارف » الجزء‎ ql JE حسن (عباس): النحو‎ (Y) 
YOV ینظر: الصدر السابق» ص‎ )۳( 

۰۲۷۱ الصدر السابق» ص‎ (E) 

. ١185 الدحداح (إنطوان): في لغة النحو العري» ص‎ Co) 


کو 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


والونث والفرد والثنی والجمع: الذي» التي... والشترك الذي یبقی بلفظ واحد مع 
الجميع: d o‏ 

° اسم إشارة DemoPro‏ 

اسم يدل على معيّن بالاشارة إليه سواء آکان إنسانًا أو حیوانا أو شيئًا أو مکانا. مثال 
ذلك إشارة القريب ”هذاء هذه» هؤلاء“ وإشارة البعید ”ذلك تلك» آولئك*. € 

CD العدد‎ e 

اسم يدل على العدد الترتيبي الرقمي» مثل: الأرقام العددية ( ۳, OY‏ التواریخ 
(۲۰۰۹-۲۱-۵). 

۲-۱-۱-۳ خصائص الاسم الصرف-نحوية: 

تندرج خصائص الاسم في عدد من العلامات: 

۱-۲-۱-۱-۳ علامات اللواصق 

NullPrefix لا سابق‎ e 

علامة تستخدم للدلالة على عدم وجود سابق» يسبق جذع الكلمة (الاسم). 

NullSuffix لا لاح‎ e 

علامة تستخدم للدلالة على عدم وجود لاحق» يلحق جذع الكلمة (الاسم). 

۲-۲-۱-۱-۳ علامات الصرف 

NoSARF منوع من الصرف‎ e 

هو الاسم العرب الذي لایدخله التنوین في آخره» وتکون الفتحة علامة لجره. مثال 
ذلك مورت سلیان ,۹۳ 

Y-Y-Y- Y-Y‏ علامات التعریف 

Definit آداة التعریف‎ e 

حرف تعریف یدخل على الاسم النكرة لیعرفه. مثال ذلك ”أل“ في كلمة ”الرجل“. 

£-Y-Y- Y-Y‏ علامات انس 

« مذکر Masc‏ 
C)‏ الصدر السابق» ص ۳۳. 
(Y)‏ الصدر السابق» ص ١٠١‏ . 


.YYA v? الصدر السابق»‎ (yY) 


- es 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


هو ما يمكن الإشارة إليه باسم الإشارة المذكر سواء OUT‏ مفردًا أو مثنى أو جمعًا. 
مثال ذلك عیسی“. 

Femin مؤنث‎ e 

هو ما یمکن الاشارة إليه باسم الاشارة المؤنث سواء آکان مفردّا أو مثنی أو جمعًا. 
مثال ذلك FAL‏ 

o - ۲-۱-۱-۳‏ علامات العدد 

Single مفرد‎ © 

وضع صرف للاسم الذي يدل على واحد. 

و مثنی Binary‏ 

وضع صرفي يدل على اثنين من الاسم الفرد. 

Plural جع‎ e 

وضع صرفي يدل على آکثر من اثنين. 

5-7-1-1 علامات للدلالة على ما یل: 

l RelAdj »نسب‎ 

إلحاق ياء مشددة بالاسم للدلالة على انتساب الشيء إليه. 

Adjunct مضاف‎ e 

هي أسماء ناقصة الدلالة بنفسها؛ لذا لا تنفك عن الاضافة أي تحتاج إلى مضاف إليه 
یوضح معناها. مثال ذلك أيء إزاء» آمام» eld‏ تحت» قبل» فوق.... 

»غير مضاف NonAdjunct‏ 

هي الاسیاء التي تحتوي في آخرها على نون التثنية وجمع الذکر السام وملحقاته|. 
مثال ذلك (الحنسيّن» الحترفین, اثنان» آهلون). 

۷-۲-۱-۱-۳ علامات الاعراب) 

MARF مرفوع‎ * 

ویقصد بها هنا بالرفوع الاسیاء التي تحمل علامات الرفع الفرعية مثل الالف في 
حالة المثنى» والواو في الأساء الخمسة» والجمع المذكر السام. 


(۱) لما كان التعامل مع النص غير الشکول فحسب. فكان الاقتصار على العلامات البارزة (الحروف) في هيئة الكلمة 
المتمثلة في إعراب المثنى وجمع المذكر السالم» وملحقاته). 


eyes 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


ویقصد بها هنا بالمنصوب الأساء التی تحمل العلامات القطعية الدالة على النصب 
مثل الألف في الأساء الخمسة: أكرم الناس آباك. 

MANSS MAGR منصوب أو رور‎ o 

ويقصد بها هنا بالمنصوب أو المجرور الأسماء التي تحتمل حالتي النصب والجرء 
لتشابها في حمل علامة الياء والنون في المثنى وجمع المذكر السالم. مثل زرت العاتلتان 
بالأمس» ورأيت المحترفين في الشارع. 


MAGR رور‎ » 

والقصود هنا بالجرور الأسماء التى تحمل العلامات القطعية الدالة على الجر مثل 
الیاء في الاسیاء EL‏ اور ان 

ومن آمثلة عنونة القسم الكلامي ”الاسم“ في الدونة اللغوية عينة الدراسة: 


العنونة باللغة العربية العنونة باللغة الانحليزية 
وقت لا سابق +اسم+لا لاحق NullPrefix--Noun*NullSuffix‏ 
الشعار تعریف+اسم+لا لاحق Definit-Noun-NullSuffix‏ 
الحالة تعریف+اسم +مونث+مفرد عم Definit-Noun*Femin*‏ 
تعر یف + اسم + چ . Definit-Noun-NoSARF-Plural--Mas‏ 
x Ca aie, WAT‏ 
Lal‏ ف+جمم+مذ کر Y+‏ لاحق c-NullSuffix‏ 
تع يف +ا | Definit-Noun4SubjNoun-*Femin-*S‏ 
العامة Ma pue cue‏ 
فاعل get‏ +مفرد ingle‏ 
سياسات لاسابق +اسم +مؤنث+ جمع NullPrefix+Noun+Femin+Plural‏ 
لا سا NullPrefix--Noun-*NounlInfinit-Nul : y‏ 
اعتبار سابق+اسم +مصدر + لاحق ISuffix‏ 
Y‏ سا +اسمدی: . NullPrefix+Noun+tNoSARF+Plural+‏ 
الصرف+جمع+ لا لاحق NullSuffix‏ 


P 


هذه ا لطبعة 


إهداء من الرکز 
ولایسمح بنشرها ورقياً 


أو تداولها تجاریا 


العنونة باللغة العربية 


العنونة باللغة الانجليزية 


هذه 


۱۹۹ 


تعریف+اسم+اسم 
فاعل + جع +مذكر +غير 
مضاف+منصوب أو جرور 
تعریف+اسم+عمنوع من 
الصرف+لا لاحق 
تعریف+اسم+اسم 
موصول+مذکر+مفرد+لا لاحق 
تعریف+اسم +نسب +مؤنث +مفرد 
N‏ سابق+اسم+اسم 
إشارة+مذكر +مفرد 
تعریف+اسم+اسم 
زمکان+مونث+مفرد 
تعریف+اسم+اسم 
مصدر +مؤنث +مفرد 


تعریف+اسم+اسم مفعول+لا 
لاحق 


تعریف+اسم +مر فوع +مثنی +غیر 
مضاف 
لا سابق+اسم+مذکر+مفرد+مضا 
ف+منصوب +لا لاحق 
لا سابق+اسم+مذک ر+مفرد+مضا 
ف+جرور+لا لاحق 


عدد 


Definit-Noun-*SubjNoun-Plural--Ma 
sc*NonAdjunct-MANSS-MAGR 


Definit-Noun-- NoSARF-NullSuffix 


Definit*Noun-RelPro-Masc- Single 
+ 


Definit+Noun+RelAdj+Femin+Sin 
gle 


NullPrefix+Noun+tDemoPro+Masc+ 


Single 


Definit+Noun+TimeLocNoun+Femi 


n+Single 


DefinittNoun+NounInfinitLike+Fem 
in+Single 


DefinittNoun+ObjNoun+NullSuffix 


Definit+Noun+tExaggAdj+Binary+N 
onAdjuncttMANSS+MAGR 


Definit-Noun- MARF-Binary*Non 
Adjunct 


NullPrefix-Noun-*-Masc* Single Adj 
unct- MANSS-NullSuffix 


NullPrefix-Noun-*-Masc* Single Adj 
unct-MAGR-NullSuffix 


CD 


امحدول: ۲۳ عنونة القسم الکلامی ” الاسم“ في الدونة اللغوية عينة الدراسة 


۳ب 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


۲-۱-۳ الفعل 

هو ما يدل على شيئين معّاء حالة أو حدث» des‏ زمن يقترن ee‏ ضرب. شرب 
فعل. ویتمیز الفعل في القواعد بموضوعین ختلفین: آنواعه و خصائصه: © 

۱-۱-۱-۳ آنواعه: ینقسم الفعل إلى قسمين رئیسیین: 

Madi الفعل‎ ۱-۱-۱-۱-۳ 

فعل پرتبط aeli‏ عن طریق النسبة الإسنادية» ویتمم بذلك العنی القصود. وهو 
نوعان: 

Transitive e الفعل اللاز‎ o 

هو الفعل الذي یستقر حدوثه في فاعله» ويكتفي برفعه؛ لیتم معناه. مثال ذلك 
مات حسن» طهر. 

InTransitive الفعل التعدي‎ o 

هو الفعل الذي یتجاوز فاعله» وینصب مفعولا به؛ لیستکمل معناه. مثال ذلك 
ا 

ویقسّم الفعل المتعدي إلى قسمين: 

Active للمعلوم (للفاعل)‎ em ۰ 

هو الفعل العلوم الذي یذکر معه فاعله. مثال ذلك الفعل شرب في جملة "شرب 
أحمد اللي“ 

Passive للمجهول (للمفعول)‎ a « 

هن cob diae pea‏ ات اع رای Uoc ddl‏ ول شا 
قرف ملد" قرب ای 

Í‏ ۲-۱-۱-۱-۲ الفعل الناقص 

VerbNAASIKH فعل ناسخ‎ e 

هو الفعل الذي يدخل على الجملة الاسمية» فیرفع البتداً ویسمی اسمهاء وینصب 
الخبر ویسمی خبرهاء فيغيرهما لفظا بنقل الاعراب من حال إلى حال» ويغيرهما معن 


۰۲۲۸ الصدر السابق» ص‎ (Y) 


ب 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


بنقل حدوث الزمن من زمنِ c‏ مثال ذلك“ كان الطالب مجتهدًا في دراسته“. © 

۲-۱-۱-۳ خصائص الفعل الصرف-نحوية: 

۱-۲-۱-۱-۳ علامات اللواصق: 

NullPrefix لاسابق‎ e 

علامة تستخدم للدلالة على عدم وجود سابق يسبق جذع الکلمة (الفعل). 

NullSuffix لاحق‎ Y e 

علامة تستخدم للدلالة على عدم وجود لاحق یلحق جذع الکلمة (الفعل). 

Present مضارع‎ e 

علامة تستخدم للدلالة على حرف الضارعة (الیاء - التاء - اهمزة - النون) الذي 
یسبق جلع الفعل. 

Future استشبال‎ © 

علامة تستخدم للدلالة على حرف الاستقبال( السین) الذي یسبق الفعل الضارع. 

۲۲-۱-۱۳ الزمن: 

Past ماض‎ e 

هو ما يدل على صيغة جذع الفعل الاضي الذي يدل على حدث حصل قبل عملية 
التکلم. وتتمثل صيغته في الفعل الاضی: مثل وضحء شرب آکل. 

PresImperat مضارع أو آمر‎ o 

هو ما يدل على صيغة جذع الفعل الأمر الذي یصاغ من الفعل الضارع العلوم ثم 
يجزم ويحذف منه حرف الضارعة مثل: دع قل. 

Imperative آمر‎ 

هو ما يدل على صيغة جذع فعل الأمر الذي یصاغ من الفعل الضارع المبني العلوم 
أو العلوم فاعله إذا كان ما بعد حرف الضارع ساکنا فتزاد همزة في آوله. مثل: c Jic‏ 


اعلم أكرم. 
)١(‏ الدحداح (إنطوان): في لغة النحو العربي» ص۲۳۹. 


eure 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


۳-۲۱-۱۳ الجنس 

Masc مذکر‎ e 

هو ما یمکن تحدیده من خلال مورفیات صيغة الفعل الدالة على التذکیر مثل 
لواحق أو سوابق الغائب الذکر أو الخاطب الذکر أو التکلم الذکر التصلة بالفعل. 
مثال ذلك الضمیر فى کتبت. 

Femin مونث‎ e 

هو ما یمکن تحدیده من خلال مورفیات صيغة الفعل الدالة على التأنيث مثل 
لواحق أو سوابق الغائب المؤنث أو الخاطب المؤنث أو التکلم المؤنث التصلة بالفعل. 
مثال ذلك الضمیر ف کتبت. 

£Í-Y- Y- Y- Y‏ العدد: 

Single مفرد‎ e 

هو ما یمکن تحدیده من خلال صيغة الفعل الجردة من السوابق واللواحق الدالتین 
فل الات وال کس: 

و مثنی Binary‏ 

هو ما یمکن تحدیده من خلال لواصق التثنية (الالف والنون» والیاء والنون) 
التصلة بالفعل. 

و جع Plural‏ 

هو ما یمکن تحدیده من خلال لواصق الجمع التصلة بالفعل. 

۵-۲-۱-۱-۳ الحالة الإعرابية 

MARF مرفوع‎ e 

ویقصد هنا بالرفوع الأفعال التي تحمل علامات الرفع الفرعية مثل الرفع بثبوت 
النون نيابة عن الضمة في الافعال الخمسة: یفعلان یفعلون تفعلان تفعلون تفعلین. 

MANSS #منصوب‎ 

ویقصد هنا بالمنصوب الأفعال التی تحمل العلامات القطعية الدالة على النصب 
مثل حذف النون من الأفما ل اة ادا باللام الناصبة. 

« منصوب أو مجزوم MANS MAJZ‏ 

ويقصد هنا بالمنصوب أو المجزوم الأفعال المضارعة التي تتشابه في نيابتها عن 


du 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


علامتها الأصلية في حالتي النصب والجزم بعلامة حذف النون في الأفعال الخمسة. 
* مجزوم MAJZ‏ 
ویقصد هنا بالجزوم الأفعال الضارعة التي تختص بصيغة الأمر للمخاطب. مثال 
ذلك اسمع» طالب. 
ومن آمثلة عنونة القسم الكلامي " الفعل" في الدونة اللغوية عينة الدراسة: 


العنونة باللغة العربية 


العنونة باللغة الانجليزية 


دعت 


Tala 


فعل +ماض+لا لاحق 
لاسابق+مبني 
للمعلو م+فعل +ماض +مؤنث +مفرد 
توكيد+مبني للمعلوم+فعل+ماض+ لا 
لاحق 
استقبال+مضارع+مبني 
للمعلوم+فعل +مرفوع+ضمیر رفع 
استقبال+مضارع+مبني 
للمعلوم+فعل+لا لاحق 
N‏ سابق + أمر +مبني للمعلو Y+ pete‏ 
لاحق 
y‏ سابق+مبني 
للمعلوم+فعل+ماض +ضمیر رفع 
لمعاو Cecil ad‏ امو دخ 
لاسابق+مبني 
للمجهول+فعل+ماضص+مونث+مفرد 


لاسابق+مبنی 


للمجهول+فعل +ماض + لا لاحق 


siye 


NullPrefixActive- Verb-* Pas 
t-NullSuffix 


NullPrefix--Active* Verb--Pas 
t-Femin*Single 


Confirm-*Active* Verb* Past 
NullSuffix 


Future Present--Active* Verb 
*MARF-*SubjPro 


Future-Present--Active-* Verb 
*NullSuffix 


NullPrefix--Imperative--Activ 
et Verb*NullSuffix 


NullPrefix-Active- Verb Pas 
t*SubjPro 


NullPrefix--Imperative-Activ 
e*Verb-MAJZ-*SubjPro 


NullPrefix-Passive* Verb*Pa 
st-Femin-Single 


NullPrefix+Passive+Verb+Pa 
st-NullSuffix 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


ای اس اه العنونة باللغة الانحليزية 
NullPrefix-Verb--Intransitive N‏ 
سابق +فعل + لازم +ماض +مؤنث +مفرد +Past+Femin+Single‏ 
لا سابق+فعل+لا لاحق NullPrefix* Verb--NullSuffix‏ 
سف NullPrefix-- VerbNAASIKH- NE‏ 
arm‏ بت NullSuffix OP‏ 
لا سابق+ فعل NullPrefix-- VerbNAASIKH--‏ 
ناسخ +ماض +مؤنث +مفرد Past+Femin+Single‏ 
ParticleNAASSIB- Present TT "‏ 
"EET .‏ 
Active- Verb--Intransitive--N vil e 7 cad‏ 
للمعلوم+فعا +لازم+ 2 
ullSuffix EET s gs j‏ 
مضارع +مبنی للمعلو م+فعل +منصوب | Present+Active+VerbtMAN‏ 
أو مجزوم +ضمير رفع S-MAJZ-^SubjPro‏ 
مضا رع +مبني ۳۲۵۵۵۲۲۲۵۵۱۷۵۷۵۵ 
للمعلوم +فعل +مر فوع +ضمير رفع F-*SubjPro‏ 
NullPrefix‏ 
لا سابی+آمر+فعل +مجزوم+ضمیر رفع *Imperative-- Verb--‏ 
MAJZ+SubjPro‏ 
لا سابق+مبنی للمعلو م+فعل +مضارع | NullPrefix+Active+Verb+Pre‏ 
أو آمر+لا لاحق sImperat--NullSuffix‏ 


امحدول:4 Y‏ عنونة القسم الكلامي ” الفعل؟ في المدونة اللغوية عينة الدراسة 


۳-۱-۳ الآداة 
الاداة مصطلح يؤدي معنى التعليق أو الربط» والعلاقة التي تعبر عنها الاداة إن 
تكون بالضرورة بين الأجزاء المختلفة من احملة. O‏ وقد اشتملت الفئة الكلامية على: 


(۱) حسان (تمام): اللغة العربية معناها ومبناهاء ص AYY‏ 


-١45- 


إهداء من رکز 
ولایسمح بنشرها ورقياً 
أو تداولها تجاریا 

© حرف جر Prepos‏ 

هو الحرف الذي يدل على معنی في غيره» أي الاسم الذي يليه مباشرة» وذلك بجره 
إلى متعلقه. وحروف ال حر تسعة عشر حرفا منها: في» على» ب ...© 

Interj حرف نداء‎ e 

”هو حرف معنى يستخدم لتوجيه دعوة ما أو تنبيه المخاطب“. وقد اشتملت اللغة 
العربية على ثانية حروف نداء منها: ياء أياء و آي O el‏ 

« الجار والمجرور PrePronComp‏ 

يقصد بالجار والمجرور هنا المركب غير الكلامي الذي يتكون من حرف الجار 
والضمير الذي يليه باعتبارهما وحدة نحوية واحدة. مثال ذلك اء فيهاء فيه» به. 

هحرف ناسخ ParticleNAASIKH‏ 
إعراب ركنيها. ud s‏ هذه العلامة عن حروف إن وأخواتها فحسب. 

Conj العطف‎ ٠ 

"هو حرف معنی یستخدم لشاركة العطوف والمعطوف عليه في اللفظ والمعنى“ 
وتعبر هذه العلامة عن الحروف التالیة: الواوء أوء ثم الفاء بل. 9 

Confirm التو کید‎ eye 

هي لام مفتوحة غير عاملة تفید توكيد مضمون الجملة. وتدخل على الاسم لتأکیده 
مثل: لمحمدٌ عظيم» وعلى ضمير الفصل مثل: محمد هو الصادق» وعلى إن الشرطیة: 
لئن تذاکر» ستنجح» وعلی جواب القسم لتفید التوکید: لقد أفصحت وقائع عام کامل. 

InterrogArticle أداة استفهام‎ e 

هي آداة یستعلم بها عن شيء أو c pl‏ وتتضمن حروف الاستفهام: احمزق هل 
)١(‏ الدحداح (إنطوان): في لغة النحو العربي» ص MY‏ 
(Y)‏ الصدر السابق» ص ۰۱۳۸ 


T4 الصدر السابق» ص‎ (Y) 


ES 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


وأسماء الاستفهام: كيف. متی» من ماذاء ما » أي» کم cul‏ أيان. V‏ 

JAAZIMA جازمة‎ e 

هي الأداة التي تجزم الفعل الضارع مثل: لم لاء لام الأمرء لا الناهية. 

« شرطية جازمة condJAAZIMA‏ 

هي الأداة التي تجزم فعلین مضارعین ( فعل الشرط وجوابه» مثل: co]‏ إذماء من 
مهماء أي آینا» oli‏ أني» حیشا. 

« شرطية غير جازمة CondNotJAAZIMA‏ 

هي آدوات تتضمن معنی الشرط ولا تجزم» وهي: d]‏ لو لولاء أمّاء ناه s‏ 

Except استثناء‎ © 

هي أداة تخرج الاسم الواقع بعدها من حكم ما قبلهاء وهي: إلاء سوی» غير» بيده 
dae‏ لا de‏ 

LAATA لات (نافية مشبهة بلیس)‎ e 

حرف نفي مشبه بليس» یدخل على الجملة الاسمية فیرفع البتداً ویسمی اسمها؛ 
وینصب ابر ویسمی خبرها. ومن شروطها حذف اسمهاء وآن یکون اسمها وخبر‌ها 
من أسماء الزمان. © 

LAA لا (النافیة)‎ e 

حرف معنی مبني على السکون لا حل له من الاعراب؛ ویشمل هذا الحرف: حرف النفي 
الشبه بلیس Y)‏ شجاعٌ خذولا)» حرف النفي للجنس ( لا رجل في الدار)؛ حرف النهي Y)‏ 
تفعل (CS‏ حرف جواب (آمسافر آنت...ل۷) » حرف النفي V)‏ يوجد عمل هنا). © 

NoSyntaEffect ille غير‎ e 

حرف معنى لا عمل له أي لا eoa‏ تغييرًا شكليًا في غيره سواء أكان اسا أو فعلاء 
ومن هذه الحروف غير العاملة: قد» OS‏ سوف. AS‏ بلى» نعم» co] dà]‏ ماء أمّاء deo‏ 
(۱) المصدر السابق» ص ۸. 
(Y)‏ الصدر السابق» uo‏ ۲۷. 


)»( الصدر السابق» ص ۰.۲۷۲ 


ب 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


لولاء آنذاك لوء اي هلا. O‏ 

ParticleNAASSIB ناصب‎ e 

هي الأداة التي تنصب الفعل المضارع» مثل: آن» لن» إذن» كي أو لكي» حتى» أن 
الضمرة. 

MASSDARIYYA مصدرية‎ e 

يقصد بالصدرية إمكان تأويل حرف ”ما“ المصدري مع ما بعده بمصدرء ويطرد 
وقوعها في الكلمات الآتية: ler‏ حيناء بعدماء طالماء مثلما»... 

۱-۳-۱-۳ خصائص الأداة الصرفية 

۱-۱-۳-۱-۳ علامات اللواصق: 

NullPrefix لاسایق‎ e 


هي علامة تستخدم للدلالة على عدم وجود سابق» يسبق الأداة. 
e‏ لا لاحق NullSuffix‏ 

هي علامة تستخدم للدلالة على عدم وجود لاحق» يلحق الأداة. 
ومن أمثلة عنونة القسم الكلامي ” الأداة“ في المدونة اللغوية: 


RT‏ الل اة العنونة بال از تس بة 
ال لا سابق+حرف جر+لا لاحق NullPrefix*Prepos-NullSuffix‏ 
يا لا سابق+حرف نداء+لا لاحق NullPrefix--Interj*NullSuffix‏ 


NullPrefix*PrepPronComp-*NullS 
- i سابق+جار وجرور+لا لاحق‎ Y ها‎ 


uffix 
NullPrefix*ParticleNAASIKH--Nu NN OE LN T 
s uu du ۳ 
lISuffix اولوق‎ cu iis 5 
NullPrefix-Conj-NullSuffix سابق+حرف عطف+لا لاحق‎ Y آو‎ 
Confirm*NoSyntaEffectFNullSuffix | لاحق‎ Veille لقد لام توکید+ غير‎ 


دالا ع 1ك 


1 ۸ 


هذه الطبعة 


إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


الا 


لا سابق+أداة استفهام+لا لاحق 
لا سابق+جازمة+لا لاحق 
لا سابق+ شر طية جازمت+ظرف+لا 
لاحق 
لا سابق + شرطية غير 
جازمة+ظرف+ لا لاحق 


لا سابق+استثناء+لا لاحق 
لا سابق +لا+لا لاحق 
لا سابق+غير عاملة+ لا لاحق 


لا سابق+ناصب+لا لاحق 
لا سابقی+ظرف+مصدریة+ لا 
لاحق 


العنونة باللغة الإنجليزية 


NullPrefix--InterrogArticle--NullS 
uffix 
NullPrefix--JAAZIMA-NullSuffix | 

CON 
NullPrefix-CondJAAZIMA-*DZAR 
F«*NullSuffix CON 
NullPrefix--CondNotJAAZIMA-No 
SyntaEffect-NullSuffix CON 


NullPrefix--Except--NullSuffix 


NullPrefix- LAA-NullSuffix 


NullPrefix--NoSyntaEffect*NullS 
uffix 
NullPrefix-ParticleNAASSIB-Nu 
llSuffix 
NullPrefix-x« DZARF-MASSDARIY 
YA-«NullSuffix 


Y oid adl‏ عنونة القسم الکلامی ” الأداة“ في الدونة اللغوية عينة الدراسة 


£Í- Y- Y‏ الظرف 


هو كلمة تدل على الزمان أو الكان الذي يقع فيه الفعل؛ ويتضمن معنی P‏ 


باطراد. وهناك نوعان من الظروف» ظرفٌ غير متصرف لا يستعمل إلا ظرقاء وظرفٌ 
متصرف يستعمل ظرفا وغير ظرف. وما يعنينا هنا الظرف الخالص فحسب. O‏ 
e‏ الظرف DZARF‏ 
تعبّر هذه العلامة عن الظرف غير المتصرف الذي لا يتسعمل إلا ظرفًا مثل: حیث» 


wal un عند» دون»‎ «eel نم‎ «QJ قط‎ S| 


rA 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


۱-4-۱-۳ خصائص الظرف الصرفية 
۱-۳--۱-۱علامات اللواصق: 


NullPrefix لاسابق‎ e 
هي علامة تستخدم للدلالة على عدم وجود سابق يسبق الظرف.‎ 
NullSuffix لاحق‎ Y e 


هي علامة تستخدم للدلالة على عدم وجود لاحق يلحق الظرف. 
ومن أمثلة عنونة القسم الكلامي " الظرف“ في الدونة اللغوية: 


العنونة باللغة العربية العنونة باللغة الانحليزية 
إذ لا سابق+ظرف+لا لاحق NullPrefix- DZARF-*NullSuffix‏ 
هنا لا سابق+ظرف+لا لاحق NullPrefix+DZARF+NullSuffix‏ 
تحت لا NullPrefix- DZARF-*Adjunct*NullSu | Ye Ua b+ SL.‏ 
لاحق ffix‏ 
لا سابق+ظرف+مضاف+لا | NullPrefix-DZARF-Adjunct-NullSu‏ 
عند 


ffix 


لاحق 
ابحدول: ۲ عنونة القسم الكلامي ” الظرف” في المدونة اللغوية عينة الدراسة 

Translit عربية‎ pé كلمة‎ ٩-۱-۳ 

هي كلمة معربة تعریبّا صوتیّاه وتشیع في العربية العاصرة لا سيا في لغة الصحافد. 


مثال ذلك تکنوقراطی» سایکس-بیکو واشنطن» الیونیفل. 
ومن آمثلة عنونة القسم الكلامي ” كلمة غير عربية“ في الدونة اللغوية: 


- 0 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


العنونة باللغة العربية العنونة باللغة الانجليزية 


أثينا كلمة غير عربية Translit‏ 
اسلام_اونلاین كلمة غير عربية Translit‏ 
الأسكواش كلمة غير عربية Translit‏ 
الریموت كلمة غير عربية Translit‏ 
Li‏ كلمة غير عربية Translit‏ 
الكلور كلمة غير عربية Translit‏ 
EI‏ كلمة غير عربية Translit‏ 
النيوترون كلمة غير عربية Translit‏ 
آنفلونزا كلمة غير عربية Translit‏ 
جاكلين كلمة غير عربية Translit‏ 
جورج كلمة غير عربية Translit‏ 
ديزن كلمة غير عربية Translit‏ 
سانت_أندروز كلمة غير عربية Translit‏ 


امحدول: ۲۷ ge‏ القسم الكلامي ” كلمة غير عربية“ في المدونة اللغوية عينة الدراسة 


Punc الترقيم‎ 2T 
هو مجموعة من العلامات الرمزية التي تستخدم لتنظيم النص الكتابي» بحيث‎ 
الفاصلة المنقوطة (؛)ءالنقطتان الرأسيتان‎ (e) يسهل تقسيمه وقراءته. وهي الفاصلة‎ 
علامة‎ (C) القوسان‎ C7 -( الشر طتان‎ (OD) علامة الاستفهام(؟) علامة التعجب‎ C) 

الحذف (...) علامة التتصیص (C)‏ علامة اخط الائل (/). 
ومن آمثلة عنونة القسم الكلامي " الترقيم“ في الدونة اللغوية: 


۱ D m 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


العنونة باللغة العربية العنونة باللغة الإنجليزية 

: علامة ترقیم PUNC‏ 
e‏ علامة ترقیم PUNC‏ 

علامة ترقیم PUNC‏ 

علامة ترقیم PUNC‏ 
" علامة ترقیم PUNC‏ 
f‏ علامة ترقیم PUNC‏ 
! علامة ترقیم PUNC‏ 
/ علامة ترقیم PUNC‏ 
- علامة ترقیم PUNC‏ 
( علامة ترقیم PUNC‏ 
) علامة ترقیم PUNC‏ 

علامة ترقیم PUNC‏ 
i‏ علامة ترقیم PUNC‏ 


الجدول:۲۸ عنونة القسم الکلامی ” الترقیم* في المدونة اللغوية عينة الدراسة 


کک 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الفصل الثالث 


العنونة بالعلاقات التركيبية 


مقدمة: 

Gb‏ العنونة بالعلاقات التركيبية في قمة الحرم التدريجي للبناء» فبها يكتمل البناء 
الشجري النحوي الذي تمخض عن تكامل المراحل الثلاث التنظيمية (الدونة 
اللغوية - العنونة بالاقسام الكلامية - العنونة بالعلاقات التركيبية). وقد تناولت في 
هذا الفصل -بداية - تعريف العلاقات التركيبية» ودورها في تحديد أبنية الجمل» ثم 
شرعت في بيان مفهوم العنونة بالعلاقات التركيبية» وأهميتها على الصعيدين اللغوي 
والحاسوبي» ثم عرضت الطرق الإجرائية التي تنطلق منها العنونة التركيبية (التمثيل 
النحوي - المحتوى النحوي - النظرية النحوية)» وأخيرًا يعرض الفصل g3l‏ من 
عنونة المدونة اللغوية - عينة الدراسة - بالعنونة بالعلاقات التركيبية على المستوى 
المكوناتي والوظيفي. وقد جاء هذا الفصل في ثلاثة مباحث على النحو التالي: 

.١‏ المبحث الأول: العلاقات التركيبية. 

- ما أهمية التحليل بالعلاقات التركيبية؟ 

". المبحث الثاني: العنونة بالعلاقات التركيبية. 

- لاذا العنونة بالعلاقات التركيبية؟ 

- التمثیل النحوي. 


e 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاريا 


- المحتوى النحوي. 

- النظرية النحوية. 

Y‏ البحث الثالث: عنونة الدونة اللغوية - عينة الدراسة - بالعلاقات التركيبية. 
às -‏ العناصر الأساسية للتحلیل الترکیبی. 

- فئة السات النحوية الوظيفية. l‏ 


oa 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


المبحث الأول 


العلاقات التركيبية 


.١‏ العلاقات التر كيبية 

بهدف ele‏ التركيب Syntax‏ إلى إيضاح القوانين والعلاقات التي تحكم أبنية 
الجملء لمحاولة فهم النظام الذي يجري عليه الاتتلاف بين مكونات الجملء إذ التعرف 
على العلاقات التركيبية المتمثلة في الربط والارتباط بين أجزاء الجملة» يؤدي إلى إبراز 
المعنى الدلالي المستهدف من ذلك النظم. 

ويرتبط مفهوم التركيب في الجملة وعناصرها والعلاقة الناشئة بين وحداتها 
بالدراسات اللغوية الحديثة بيد أنه متأصل في تراثنا النحوي» حيث توصل عبد القاهر 
الجرجاني في كتابه دلائل الاعجاز إلى نظرية تركيبية محکمة ألا وهي نظرية التعليق» 
تنطلق في دراسة الجملة من المعنى وصولا إلى المبني؛ أي وفق ما تسير عليه عملية 
الاتصال اللغوي. ويرسي عبد القاهر دعائم هذه النظرية بمبدثه الذي حدد آبعاد "VES‏ 
من الناحية الدلالية» إذ يقول: «إذا قلت: ضرب زید عمرًا يوم الجمعة ضربًا شديدًا 
Gob‏ له. فانك تحصل مجموع هذه الكلم كلها على مفهوم هو معنى واحد لا عدة 
معان» كما يتوهمه الناس)”©. وهذا يرشدنا إلى أن الجملة ذات معنى دلالي واحدء ينشأ 


(۱) الجرجاني (عبد القاهر): دلائل الاعجاز» تحقيق أبي فهر حمود محمد شاكر» مكتبة الخانجي - القاهرةه A b‏ ١199م‏ ص417. 


2۷ 0 ۵ 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


من التفاعل بين العاني الجزتية التمثلة في مکونات الحملة أي أن الترکیب هو الوسيلة 
الباشرة لنشوء هذا العنی الواحد. 

ومع ذلك لم نحاول استغلال هذه النظرية في درسنا النحوي ولا توظیفها في موضع 
ملائم OU.‏ هکذا تعودنا - للأسف - على أن ننتظر أن تأت لنا الحلول جاهزة من قبل 
العلماء الغربیین في ظل توطد العلاقة بين اللغة والعلوم الأخرى التي تبدف إلى فهم 

اتجه علماء اللغة الغربیون في الأربعینات من القرن الاضی إلى الوصف والتنظیر 
للجملة بشکل عام في إطار العدید من النطلقات الفكرية والفلسفية؛ لیخ جوا بمسلمة 
مفادها أن حور تحلیل الجملة هو العلاقات التركيبية.:9) 

ثم أثمر التفاعل بين الستویات اللغوية الختلفة عدة نظریات لغوية تنطلق جميعها من 
العلاقات التركيبية باعتبارها CIUS‏ تنتظم العاني بداخلها في إطار مبادی النظرية» على سبیل 
المثال نظرية دي سوسبر التی اتخذت العلاقات وسيلة ها في دراسة التفاعل بين الکلیات 
وتأثر ذلك في تکوین الجمل. وكذلك نظرية بلومفیلد التوزيعية التی اعتمدت على تجزئة 
الجملة إلى مکوناتها الباشرة ثم إلى مكوناتها النهائية هدف توزیع الوحدات اللغوية» مع 
آنها تتتحي بالعنی جانبا... ولعل ذلك يدفعنا إلى التساؤل هل کشف بلومفیلد عن آلية 
حکمة في تقسیم الکونات الباشرة للجملة في ظل استبعاد العنی من التحلیل؟ 

ثم اتسعت دائرة التفاعل بين اللغة والعلوم الاخری لاحتواء إشكالية اللغة 
المتشعبة» الأمر الذي آدی إلى انطلاق العدید من النظریات النحوية العامة؛ لتفسبر 
الظواهر التركيبية في إطار رياضي ومنطقي. 

وقد تمركز جل هذه النظریات في اتجاهين آساسیین لتحلیل الظاهرة النحوية في إطار 
(V)‏ يقف الدكتور مصطفی حميدة موقف المتعجب من هذا الجمود الفكري وعدم التجديد ني إطار هذه النظرية التي تقف 
اليوم شاغة أمام العديد من النظريات اللغوية الحديثة» إذ يقول: «ولعل أهم ما أسداه عبد القاهر للعربية أنه وضع الدرس 
النحوي في طريقه الصحیحء وحدد له المنهج الذي يشمله من جميع جوانبه» فكان من المأمول أن يبدأ الدرس النحوي 
مرحلة جديدة من التطور في ضوء تلك النظرية المتكاملة» لكن الأمر الغريب أن من جاؤوا بعد عبد القاهر لم يفهموا مرساه 
رسوخاء ول يقع في أخلادهم أن دلائل الإعجاز كتاب في النحوء وأن النظرية التي عرضها هي أساس الدرس النحوي 
وذروة فلسفته ومنهجه القويم» فحين وجدوه يتحدث عن العاني وترتيبها في النفس وملاءمة معنى اللفظة لمعنى التي تليها 
واتحاد أجزاء الكلام ووضع الجملة في النفس وضعا واحدا ظنوه یتحدث في ele‏ جديد لايمت بصلة إلى علم النحو الذي 


co paf‏ فأطلقوا على ذلك العلم علم العاني وجعلوه مبحثا في علم البلاغة.» ينظر: 
حميدة» (مصطفی): الربط والارتباط في ترکیب الجملة العربية» مکتبة OU‏ ناشرون» ط ۰۱ ۰۱۹۹۷ ص E S‏ 


. عبادة (محمد إبراهيم): الجملة العربية» مکوناتها - آنواعها - تحليلهاء مكتبة الآداب-القاهرة» ط ۰۲۰۰۷ ص1‎ (Y) 


كن 8ت 
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العلاقات التركيبية» وهما الاتجاه التوليدي الذي يصوغ تلك العلاقات في مكونات 
تركيبية» والاتجاه التحليلي الذي يصوغ تلك العلاقات في اعتمادات مفرداتية. 


۱-۱ ما آهمية التحليل بالعلاقات التركيبية؟ 

التساؤل عن آهمية التحلیل بالعلاقات التركيبية دائم» واختلاف مشاغل القائمین 
عليه حادث حسب اختلاف الادة CO, S ll ied‏ وقد لخص ابن خلدون في 
مقدمته تلك ue ME‏ فیقول: «به تتبین أصول القاصد بالدلالة فیعرف الفاعل من 
المفعول والمبتدأ من الخبرء ولولاه Jed‏ أصل الافادة.» ”)كم أن له أهمية في تفسير دلالة 
النص» ومعرفة الخصائص الأسلوبية للنص النثري والشعري» وتحليل الخطاب؛ ومن 
ثم استنباط القوانين التي تحكمه 


۲ العنونة بالعلاقات التركيبية 

هي عملية تعبين العلاقات النحوية التي تنشأ بين أجزاء الجملة؛ نتيجة حدوث 
علاقات نحوية سياقية بين المعاني» وذلك في إطار نموذج نحوي مصطبغ بشكل رياضي 
(بنية العبارة أو بنية التبعیة) قهیدا للمعالحة الآلية للمنظومة النحوية. 

ويتم تمثيل تلك العلاقات لحمل المدونة اللغوية باستخدام مجموعة من الرموز Tag‏ 
set‏ (فاعل» مفعول» إضافة» وصف. ...) للتعبير عن المحتوى النحوي المراد إضافته 
EEN ETEA‏ 


۱-۲ ناذا العنونة بالعلاقات التركيبية؟ 

تمثل الدونات العنونة بالعلاقات التركيبية موردًا Gla‏ لمعالجة النحو ÉN‏ «تشهد 
ساحتها أي العا جة أقصى درجات الامتزاج بین اللسانیات واحاسوییات» كر تعد 
منطلقا للتحقّق من فرضیات التظریّات «O3, x‏ » فضلا عن رسم معام واضحة لنظام 


(۱) عاشور (النصف): بنية الجملة العربية بين التحلیل والنظریة» » ص V‏ 
(Y)‏ ابن خلدون ( ولي الدین عبد الرحمن بن حمد): مقدمة ابن خلدون, تحقیق عبد الله محمد الدرویش, دار البلخي - 
دمشق» ط ۰۱ الجزء الثاني» ۰۲۰۰4 ص YAV‏ 
(۳) علي (نبیل): اللغة العربية واحاسوب ص ۳۸۸. 
A. (2003). Building and Using Parsed Corpora, Springer. ۷۰‏ ,۸۵61116 )4( 
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۳ 
3 


الجملة في اللّغة الّدروسة وتحديد خصائص علاقاتها التركيبية» مييّنة وجوه الائتلاف 
والاختلاف. XUI,‏ أو عدم AI‏ في بنية Oih‏ وتتلخص أهداف المدونات 
الموضّفة بالعلاقات التركيبية في هدفين أساسيين: 


« بناء المحللات النحوية 

یعد السبب الرئیسی لعنونة المدونات بالعلاقات التركيبية هو استخدامها في تدريب 
خوارزميات التعلم SI‏ لبناء المحللات النحویة ")4 وذلك للاستفادة منها في تطبيقات 
معالحة اللغة الطبيعية المختلفة مثل: الترجمة الآلية» إجابة الاستلت تعلم النحوء التدقيق 
النحوي» تحديد أساليب الكتاب ومعرفة هويتهم التخاطب مع قواعد البيانات باللغة 
الطبيعية» التخاطب مع الإنسان الآلي Robots‏ الذي يتم عن طريق التعرف على الكلام 
ثم تحليله نحویا؛ حتى يتحصّل على المقاصد الدلالية. 

وما زالت المحللات النحوية إلى الآن — مذ ما يربو على عشرين Ule‏ في البحث 
والتطوير - تفتقر إلى الصلابة» واتساع التغطية التي تحتاجها في تحليل النصوص 
التنوعة أو الخطاب.”" ورب يعود ذلك لتنوع المستوى اللغوي - من حيث الفصاحة 
والعامية - في ضوء بزوغ مجتمع المعرفة. 

e‏ الدراسات اللغوية 

يمكن أن تكون المدوّنة الموصّفة نحويًا مصدرًا ثريا للمعلومات التي تستخدم في بناء العديد 
من التطبیقات مثل استخلاص الإطار النحوي Subcategorization Frames of JU35U‏ 
9 التى تحدد عن طريقة بنية العوامل Arguments Structure‏ واستخلاص الأنماط 
التركيبية à‏ الدونة اللغوية» واستخلاص متوسط أطوال الجمل» واستخلاص الجمل 
التكميلية Relative clauses‏ ومتوسط أطواهاء واستخلاص التراكيب النحوية بأنواعها 
المختلفة» واستخلاص الأفعال المتعدية إلى مفعولاتها الباشرة أو غير المباشرة» واستخلاص 
الخصائص التركيبية» ومن ثم وصف نظام اللغة GT‏ وزمانيًا وسياقياء... وغيرها. 


(Y)‏ عاشور (المنصف): بنية الجملة العربية بين التحليل والنظریة» ص۸. 
Habash, N. (2010). Ibid. P.104.‏ )2( 
Garside, R. & Leech, G. & McEnery, T. (1997). Ibid.36.‏ )3( 
Garside, R. & Leech, G. & McEnery, T. (1997). Ibid.34-35.‏ )4( 
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۳ الطرق الإجرائية للعنونة بالعلاقات التركيبية 

وتتوخى العنونة بالعلاقات التركيبية عدة طرق إجرائية» لا تنفك إحداهن عن 
الأخرىء فهى بمثابة أجزاء اللوحة التشكيلية التى لا يكتمل معناها إلا إذا اتحدت 
وتکاملت مع بعضها البعض"). ada p‏ الطرق التوخاة متأصلة ن التحلیل النحوي 
الحديث إلا أن الخلط بينها دائم ربا لاغفال الجانب التطبيقي اللموس في الدرس 
النحوي. وتتحقق العنونة بتوافر تلك الطرق المتلازمة الآتية: 


۳= التمثيل النحو ي Syntactic Representation‏ 

التتبع لتراكيب الجملة في أي لغة سيلاحظ أن اللغة تخضع لنظومة قاعدية في الذهن 
البشري» ربا تكون مُنشأة GU‏ وواحدة البنية في كل الأدمغة» بحيث إن إنتاج الجملة 
في أي لغة يخضع لنمط معين وترتيب خاص يفهمه النتمون للمجموعة اللسانية 
نفسهاء وي خلل في الواضع يؤدي فورا إلى فقد التواصل أو اضطرابه» وهو ما دفع 
تشومسكي إلى القول بأن النحو الكلى Universal Grammar (UG)‏ ”© موجود في 
آذمان الا طفال منذ الولادة وهو آساس کل اللغات التی یتعلمها البشی ویتمثل بکونه 
io pet‏ من المبادئ والأحياز (الحددات) S sco s «Principles and Parameters‏ 
لما يوجد في المحيط یبتکر الطفل نحوا مشترکا یسم كل هذه الأحياز بقیم Us Values‏ 
إحدى لغات البشر الممكنة التي يبدأ باء بحیث إن ذهن الطفل ینفتح آول مرة إلى أي 
لغة بشرية» منتهیا إل اکتساب لخة معينة. O‏ 

وأخيرًا أجمع باحثو اللسانیات العصبية NeuroLinguistics‏ — من خلال التجارب - أن 
المنطقة اليسرى من الفص الصدغي الأمامي Left anterior Temporal Lobe‏ تطبق نوعا 


(1) see: Rambow, 0. (2010). The Simple Truth about Dependency and Phrase Structure 
Representations.Human Language Technologies: The 2010 Annual Conference of the North 
American Chapter of the ACL, Los Angeles, California. 
إذا نظرنا إلى اللغات الاصطناعية (البرمجية) عند تعاملها مع الآلة» سنجد أنها لا تتعامل مباشرة مع الالة؛ بل هناك‎ )۲( 
التي تفهمها الآلة؛ لأا - ببساطة - تقوم على‎ Assemblyi3 يترجمها - أي اللغات البرمجية - إلى‎ compiler وسيط‎ 
رقمي الصفر والواحد. وهذا يعني أن هناك بنية لغوية واحدة تشترك فيها جميع اللغات البرمجية باختلاف تراكيبهاء وهذا‎ 
ما یتوافق نس مع عمل اللغة بشکل عام ویدعم فكرة البنية اللغوية المشتركة.‎ 
مزوني (دومينيك): قيود النحو الكلي: كيف یکتسب البشر القدرة على الکلام» ترجمة فرحات اللیح. مجلة الحياة‎ )۳( 
SYN ge cY t ۹ الثقافية. السنة ۲۷. العدد‎ 
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ما من العاحة النحوية الاساسیة وهذا ما يدعم مسألة وجود نمط معين Lih‏ بالدماغ 
البشري» إلا آنهم اختلفوا في تفسير نوع هذه المعالجة» حيث ما زال یکتنفها الغموض. 

ومع ذلك جتهد علماء اللغة محاولين تمثيل تلك المعالجحة النحوية الموجودة في الذهن 
البشري من خلال البناء ال هندسي للفضاء الذهني وتصور المعنى في الدماغ الذي ينطلق 
من مسلمة ذهنية مفادها ”أن المعنى في اللغة الطبيعية بنية معلومات مرمزة في الذهن 
البشري أو هو تمثيل ذهنی» ومن ثمة فان المعلومات التى تحملها اللغة مصوغة بالطريقة 
التي ينظم بها الذهن التجربة» ولا يمكن oid‏ المعلومات المتجلية في تعابير البنية 
التصورية أن تحيل إلى العالم الواقعي» كا في نظريات أخرىء وان إلى de‏ مُسقط ناتج 
من هذه البنية» ووليد التنظيم الذهني املكو SES‏ 

وانطلاقا من هذا الإطار التصويري لبنية المعنى داخل الذهن. افترض التوليديون 
والتحليليون وغيرهم من علاء اللغة أصحاب النظريات النحوية الحديثة نموذجًا 
افتراضیا لشكل المعرفة النحوية في ذلك الفص الصدغيء يتمثل في أن المعرفة النحوية 
عبارة عن وحدات مترابطة أو متداخلة تتفرّع عن بعضها البعض.”" وتأتى ذلك لهم 
مقاربة من شكل المشتبكات العصبية synopses‏ في الخلايا العصبية المسؤولة عن نقل 
الإشارات الكهربائية -التى تحمل المعلومات - بين تلك LAH‏ © 

ثم حاول هؤلاء العلماء تطبيق القوانين الرياضية والنطقية لنقل أنساق هذا النموذج 
المعرفي الذهني إلى أنساق صورية؛ لمحاولة تلمس هذا العالم الخفي وإدراك البنية العقلية 
اللغوية» فانطلقوا جميعا من مسلمة مفادها أن النموذج النحوي الافتراضي يتمثل في 
عدد محدود من العلاقات والقیود» تتدرّج فيما بينها في هيكل تنظيمي أي شجري.*) 

وقد أثمر النطق الرياضي في صوغه للنموذج النحوي تمثيلين نحويين» تعددت في 
إطارهما العديد من النظريات النحوية الحديثة» وهما: 
Hale, J. & Callaway, F. & Feldman, E. and Others. (2014). Modeling Neural Correlates of‏ )1( 

Syntactic Structure Building. In AMLaP 2014-Poster, Scotland. 

(۲) غالیم (محمد): هندسة التوازي النحوي وبنية الذهن العرفية. کتاب (UT‏ اللسانیات (تکرییا للأستاذ الدکتور ناد 
الوسی) مركز دراسات الوحدة العربیة» cem s jo‏ ط ۰۲۰۱۱۰۱ ص ۵۲. 


(3) Dirven, R. & Langacker, R. (1992). Grammar in Mind and Brain. Mouton de Gruyter, 
Berlin. New York. P.251 and 277. 


0-00 ص‎ ۰۲۰۱۳ CY شريف (عمرو): ثم صار الخ عقلا» طبعة مکتبة الشروق الدولی ط‎ CE) 


)0( لعل هذا الطرح يبدينا إلى إجابة مقنعة عن السوال الحیر الذي یطرحه العدید من الباحثين» وهو ما فائدة التشجیر في 
التحليل النحوي؟ بالإضافة إلى أنه الأقدر على تمثيل تلك المعرفة النحوية من الناحية الرياضية المنطقية. 
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Constituency Representation التمثيل المكوني‎ e 

Dependency Representation التمثیل الاعت‌ادي‎ e 

وبناءَ على ذلك يمكن تعریف التمثیل النحوي بأنه النموذج الرياضي الذي یعرض 
بنية lade‏ بشکل تصويري ف Jo]‏ النظرية النحوية والحتوی النحوي. وقد آسهم هذا 
التمثیل النحوي في توضیح طبيعة العرفة وآنساقها والفهم والتأويل» وني التقدم التقني 
للحوسبة computation‏ © 

Constituency Representation التمثیل المكوني‎ ۱-۱-۳ 

هو بنية شجرية منظمة» تنتظم فيها کلیات الجملة في شکل مرکبات أو مکونات نحوية 
تبعًا لنظام نحوي ‏ بحيث تظهر فیها الکلمات كعقد نهائية Terminal‏ وال رکبات كعقد غير 
.Non-Terminal isle‏ وهو ما یعرف ب آشجار بنية العبارة۲۲665 Phrase-Structure‏ . 

ویمکن توضیح العقد Nodes‏ في بنیتها الشجرية من خلال الشکل رقم ۲۷: 

Root Node 


^ ——ROOT 


Non-Terminal Nodes 
عُقّد غير بائية‎ p و‎ 
XP XP 
Terminal Nodes 
MX X X X 
الشکل: ۲۷ مخطط هيكلي لبنية الشجرة النحوية‎ 
تعنی الرکبات أو‎ (X Phrase) XP cs تعنی الکلات أو الوحدات.‎ X eu 
ويتم تنظیم هذه البنية الشجرية أو کتابتها عن طریق:‎ 


۰۱ الفهري (عبد القادر الفاسی). البناء الوازي» نظرية في بناء الكلمة وبناء الجملة» دار توبقال للناشرء الغرب» ط‎ )١( 
AV ۰ص‎ 
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۱-۱-۱-۳ التقویس Bracketing‏ 
هي عملية رياضية تنظم کلیات الجملة ومركباتها بطريقة متهاسکت بحيث تظهر 
العلاقات بينهما في صورة اعتعادية ۲ وقد اعتمدها dle‏ اللغويات الحديثة نعوم 

تشومسكي في تمثيله لقواعد النحو التحرر من السياق.“ 

إن اطلاع تشومسكي على العدید من العلوم الصورية kY Formal Science‏ 
الریاضیات والنطق وعلوم احاسوب واشتغاله بمشروع الترجمة XII‏ بمعهد 
ماساشوستس للتقنية à Massachusetts Institute of Technology (MIT)‏ 
الخمسينات من القرن النصرم ۰ جعله ینظر للغة على آنها منظومة متسقة البناءء 
شديدة الاحکام» يمكن أن تمثل في إطار رياضي حاسوی؛ لذا نجد آثر هذا التفاعل 
في كتابه التراكيب النحوية عام ce ۱۹١۷‏ حيث اقترح ثلاث طرق للتحليل النحوي؛ 
تنطلق جميعها من المنطق الرياضي الحاسوبي. 

ففي الطريقة الأولى استخدم تشومسكي آلية JULI‏ المحدودة Finite-State‏ 
Machine (FSM)‏ - التي تستخدم في تصميم التطبيقات ال هندسية والبرمجيات 
الحاسوبية“ - لتوليد الجمل بشكل تتابعي اعتمادًا على ا حالة التي تحدد العناصر التالية 
ها. ومع ذلك ”قد اختبر تشومسكي هذه الطريقة ووجدها غير صالحة للتحليل 
اللغوي؛ لأنها تؤدي إلى تقديم جمل محدودة بين تقدم اللغة جملا لا نهاية ها*.٩)‏ 

آما الطريقة الثانية والثالثة فاستخدم تشومسكي النظام الرياضي والنطق الرمزي؛ 
لوصف المكونات الباشرة حسب عناصرها في إطار القوانين والأحکام. وذلك عن 
طريق أقواس التحليل Analysis Brackets‏ التي تتشابه مع أقوامن الرياضيات 
وأساسيات العديد من اللغات البرمجية مثل لغة لیسب lisp‏ التي تنظم بياناتها وقوائمها 
بالتقویس Bracketing‏ التحليلي. ويمكثنا أن نين مدى الإحكام في طريقة التقویس 
التحليلي بالتمثيل الرياضي: 


(1) Pustejovsky, J & Stubbs, A. (2013). Ibid. 18. 
(2) Jurafsky, D. & Martin, J. (2007). Ibid. P.433. 


(3) Otero, C. (1994). Noam Chomsky: Critical Assessments.TJ Press (Padstow) Ltd, Padstow, 
Cornwall, London, P.433. 


(4) Wright, David R. (2005). “Finite State Machines". CSC215 Class Notes. Prof. David R. 
Wright website, N. Carolina State Univ. Retrieved July 14, 2012. 


.۱۳۲ الراجحي (عبده). النحو العربي والارس الحديث» بحث المنهج» دار النهضة العربية- بیروت. ط ۰۱۹۷۹۰۱ ص‎ Co) 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


فمثلا إذا كان عندنا هذه المعادلة: 

س( ص +ع) 

Ub,‏ لأسبقية ترتيب العمليات الحسابية في الرياضيات أو البرمجيات الحاسوبية» 
نجد أن مُعامل العمليات المدمجة داخل الأقواس يتصدر تلك العمليات الحسابية ثم 
يليها الضرب المتكررء ثم الضرب والقسمة ثم الجمع والطرح... وبناء على ذلك فان 
أي تغيير في العمليات الحسابية في هذه العادلة سيؤدي إلى اختلاف في النتائج. 

لنفترض أن: 

D d ٤=ص‎ ۲ = س‎ 

وبالتعويض في العادلة: س( ص +ع) 

(+0) Y= 
۱۰ « ۲ < 

إذن جموع العادلة = ۲۰ 

في حين انتزاع الأقواس ستصبح المعادلة هكذا: س× ص +ع 

وبالتعويض ف العادلة: س× ص +ع 

+x Y= 

إذن مجموع المعادلة = ۱6 

وكذلك يتم الإحكام في التمثيل النحوي للجمل عن طريق التقويس في إطار 
المعلومات النحوية المقدمة. 

ويوضح المثال التالي مدى إحكام الأقواس الرياضية في تمثيل المعاني النحوية: 

مثلا ملة: بيت محمذ الكبير ...فان كلمة " الكبي ر“ حتمل أن تكون صفة ل محمد أو 
صفة ل البيت. ومن خلال الأقواس يتين المعنيان: 

١‏ - المعنى الأول» صفة ”الكبير“ عائدة على البيت. 


S * 3 5 

وبتحويلها للشكل الشجري ‏ : 
() يتم تحويلها ÚT‏ - باستخدام العدید من الأدوات واحزم stanford-tregex Const Tree & ju i JI‏ 
Viewer‏ من خلال تنفيذ عمليات ترتيب الأقواس. وقد اعتمد تشومسكي على هذا النظام أي التقويس» ونظرًا لصعوبته 


في التحليل» فقد اعتمد أتباعه على النظام الحول له أي الشجري. انظر: اللغة والمسؤولية د.حسام البهنساوي ص 1۷. 
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هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


NP 


JUS 


NP — ADJP 


/N ا‎ 


لکد NP‏ بيت 


محمد 


فإذا نظرنا إلى مركب الصفة ADIP‏ ”الكبير“ سنجده موازيًا لرأس المركب الاسمي 
NP‏ البیت" من ناحية السيطرة المباشرة Immediately dominates‏ من المركب 
الاسمي ۱۴ الأكبر. وهو ما يعبر عن التوازي النحوي بين المركبين. 
المعنى الثانى» صفة " الکبیر" عائدة على محمد. 
(NP‏ 


(NP (NP (محمد‎ (ADJP (((الکبیر‎ 


: وبتحویلها للشکل الشجري‎ 
NP 
P نان‎ ۷ 
بيت‎ NP 
PN 
NP ADJP 
Ll 


قاذ اونا إل مر d bates ced ADIP E‏ کب ات 11۳ 
”محمد“ من ناحية السيطرة الباشرة Immediately dominates‏ من الرکب الاسمي 
۳ الکمل للم رکب الاسمي الاکبر. وهو ما يعبر عن التوازي النحوي بين المركبين. 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


۱۱-۱-۱۳ خصائص التقويس في التمثيل النحوي: 

É pulo يعد التقويس هو الطريقة الأساسية لتمثيل أشجار بنية العبارة‎ e 

* یصعب قراءتهعلی غیرالتمرن عليه لکن یمکن تحویلهلصورة - مرئية - شجرية 
من خلال بعض الأدوات الحاسوبية. 

e‏ إمكانية ضبط التحليل الشجري في شكل متدرّج» بحيث يكشف عن العلاقات 
بين المكونات في صورة هرمية كا في الأمثلة السابقة. 

e‏ إمكانية التعديل والحذف والاستبدال في البنية الشجرية عن طريق استخدام 
التعبيرات النمطية Regular Expressions‏ . 

© إمكانية استخلاص العلومات النحوية أو الأشجار الفرعية Sub-trees‏ من البنية 
الشجریة. 

NEGRA Format هيكلة نیحرا‎ ۲-۱-۱-۳ 

هي طريقة وصفية رياضية تنظم البنية الشجرية للجملة في صفوف وآعمدة ذي 
علاقات ترابطی حيث تخزن الكلمات وعناوین الرکبات Tags of Phrases‏ في تلك 
الأعمدة بطريقة رقمية ترتیبیة» یمکن قراءتها بسهولة. وقد اعتمد أسعاذ اللغویات 
| حاسوبية ثورستن برانتس Thorsten Brants‏ بجامعة سارلاند الألانية Saarland‏ 
University‏ على هذه الطريقة في وصف الدونات العنونة Annotated Corpora‏ 
بالعلاقات التركيبية لا سی| مدونة نیجرا النحوية Syntactic NEGRA‏ 

وکان ادف من هذه العملية وصف الدونات العنونة بالأقواس النحوية لا سيا 
مدونات بنسلفانیا الموصّفة؛ حتي یتسنی قراءتها؛ ومن ثم امكانية تحریرها بسهولة. 

ویوضح اثثال dii‏ كيفية قراعة مکونات البنية الشجرية الکونیة؛ لتحویلها پل 
معلوماتِ لغوية في صفوف وآعمدة. 


(1) Brants, T. (1997). The NeGra Export For Annotated Corpora. Projekt C3 NebenLaufige 
Grammatische Verabeitung. 
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هذه الطبعة 


إهداء من المركز 
ولایسمح بنشرها [m‏ 
أو تداولها تجارياً 
ROOT 2‏ 
S511‏ 
VP 510 .‏ و 
easi SBAR 509‏ 
ol S 508‏ 
NP 507 VP 504‏ 
s‏ 7 506 
"P ud PP 501‏ و توثر NP NP‏ 
NP 0‏ ل 502 NP‏ تعرقل الوضعية هذه 


النهوض البذولة الجهودات 


الشکل:۲۸ البنية الشحرية المكونية 
ومن خلال قراءة الرکبات من الأسفل إلى الأعلى في الشجرة السابق یمکننا 


رصدها في صورة جدول: 
#BOT‏ 
Word ID Word Phrases Node ID‏ 

S11 à m 511 
S1 2 csi un 510 
S13 ol a 509 
S1 4 هذه‎ o 506 
S15 الوضعية‎ m 505 
S16 تؤثر‎ IL 504 
S1 7 3 m 504 
S18 تعرقل‎ m 503 
S19 الجهودات‎ " 502 
S1 10 المبذولة‎ 502 
S1_11 ل‎ 501 
S1 12 النهوض‎ m 500 
S] 13 I 511 
#500 NP 501 

#501 PP 504 

#502 NP 503 


S uuo 


هذه ا لطبعة 


إهداء من المركز 

ولایسمح بنشرها ورقيا 

أو تداولها تجاریا 
VP 504‏ #503 
VP 508‏ #504 
NP 507‏ #505 
NP 507‏ #506 
NP 508‏ #507 
S 509‏ #508 
SBAR 510‏ #509 
VP 511‏ #510 
S 500‏ #511 
ROOT 0‏ #512 


#EOT 
هيكلة نیحرا‎ de الجدول:9؟‎ 

تبدأ العنونة بالكلمة المفتاحية "بداية «(Beginning Of Table) 8077# “J pat‏ 
وتنتهي بالكلمة المفتاحية "نهاية الجدول“ 8017# «(End Of Table)‏ ویتوسطه 
العلومات التحليلية للجملة في صفوف وأعمدة فالعمود الأول يعبر عن الوصف 
الترتيبي لوحدات الجملة» والعمود الثاني يعرض وحدات الجملة على حدة ثم في حالة 
تركيبها مع وحدات أخرىء والعمود الثالث نوع المركبات» والعمود الرابع الوصف 
التصاعدي لعقد المركبات الذي يبدأ من العدد ۵۰۰. 

۱-۲-۱-۱-۳ خصائص هيكلة نيجرا في التمثيل النحوي 

٠‏ سهولة قراءة البنية الشجرية» ومن ثم إمكانية التعديل أو الحذف أو الاستبدال 
داخل قاعدة البيانات. 

© إمكانية استخلاص العلاقات التركيبية بسهولة دون استخدام أي أدوات حاسوبية 
مساعدة» حيث يتم تخزينها باستخدام أدوات قواعد البيانات مثل مايكروسوفت 
أكسس Microsoft Access‏ أو إس كيو إل الاستعلامية .SQL database‏ 

Ub إذ لا تتطلب‎ XML إمكانية توصیفها بلخة التوصیف اخثالية القابلة للامتداد‎ e 
توي على عناصر الوثبقة.‎ Document Type Definitions (DTD) ra تعر‎ 

«أكثر ملاءمة من نظام التقويس في التعامل مع تقنيات التعلّم .Machine Learning "i‏ 

* إمكانية تحويلها إلى صورة - مرئية - شجرية مرة أخرى. 
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هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


Dependency Representation التمثیل الاعتادی‎ ۲-۱-۳ 


هو بنية شجرية منظمة» تنتظم فیها كلمات الجملة في شكل علاقات مکونة من 
مسيطر وتابع آو عدة توابع بحیث تظهر فیها الكلات كعقّد Terminal isl‏ فقط ,© 
وهو مایعرف بأشجاز بني الاعت‌ادية .Dependency Structure Trees‏ 

وتتشكل هذه البنية من خطوط متفرعة متجهة إلى الأسفل» تحكم تشعبها العلاقات 
القائمة في الجملة بين وحداتهاء كا يتوقف تدرّج أسهم تلك الخطوط بين وحدات 
الجملة على نوع العلاقات امحاصلة إذ يتطابق التدرج مع الكلمات من حيث كونها 
مباشرة (أي مرتبطة بنقطة التمركز الرئيسي) أو غير مباشرة. 

ويوضح الشكل رقم ۲۹ التدرج في البنية الشجرية الاعتمادية من خلال وحدات 
جملة " يشرب عبد الله اللبن الساخن*. 


الشکل:۹ Y‏ تمثيل العنونة eel Pose I‏ على فئات نوح سميث. (D‏ 


(1) Habash, N & Farag, R & Roth, R. (2009). Syntactic Annotation in Columbia Arabic 
Treebank, In proceedings of the 2nd International Conference on Arabic Language Resources 
Tools MEDAR).P.129. 
Guangchao Tang مفتوحة الصدر للباحث الصيني جوانجشاو‎ Dependency Viewer باستخدام أداة‎ )۲( 
الصينية.‎ Nanjing university بجامعة نانجینغ‎ 
علاقة الوصفية.‎ -amod; وزط00- علاقة الفعولیق‎ NI -det ; للمرکب)‎ 


-\ M- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بد شرها ورقياً 
أو تداولها تجارياً 


تتدرج الوحدات من نقطة Soi‏ وهي الفعل تبعًا لمدى ارتباطها بتلك 
النقطة. فنجد في الثال السابق تدرج وحدتي ” عبد الله“ و " اللبن" في مرتبة مباشرة 
للفعل» حيث يحتلان موقعي الفاعلية والفعولیة Ul‏ وحدة ” الساخن“ فهي في مرتبة 
EINE EN‏ لین سک ERE‏ 

ویتم التمثیل الاعتادي في إطار نموذج تحليلي؛ ليحدد التعلق Attachment‏ الذي 
یعنی بتوجیه العلاقات بين الرس والتابع في الجملة» وبالحتوی النحوي؛ ليحدد نوع 
تلك العلاقات labels‏ ( الفاعلية» الفعولية» الوصف. الاضافة...).۱) 

ویتم نظم هذه البنية الاعت‌ادية في صفوف وآعمدة ولعل آشهر طريقة في نظمها 
à‏ 

CoNLL Format | :$ هيكلة‎ ۱-۲-۱-۳ 

هي إحدى الطرق الشائعة في البناء الشجري ذي التمثیل الاعت‌ادي» تقوم de‏ 
توصیف البنية الشجرية الاعت‌ادية وتنظیمها في صفوف و آعمدة إلا أن الأخيرة ترتبط 
بعدد محدد يحدده ادف النشود الذي يقرره المؤتمر السنوي لتعلیم اللغة الطبيعية The‏ 
Conference on Natural Language Learning (CoNLL)‏ للآليات من خلال 
تقنیات التعلم الآلي والاحصائي» حيث بهدف هذا المؤتمر إلى تنظیم مهمة مشتركة 
Shared-Task‏ لتقییم آنظمة معالحة اللغات الطبيعية ولا سيا الحللات النحوية 
«Dependency Parsers‏ فیقوم باعطاء الشارکین مدونة لغوية معنونة» متسقة من 
حيث عدد الاعمدة التي ترتبط بحجم العلومات اللغوية القدمة في الدونة؛ لیقسموها 
إلى جزءین» جزء للتدریب «Training set‏ يتم به تدریب NI (ere‏ حصائیقف وجزء 
لتقييم هذه النماذج بعد تدريبها "Testing set‏ وقد أذَّى ذلك إلى ارتفاع مؤشرات 
تقييم المحللات النحوية القدمة لأكثر من ثلاث عشرة ]0.33 

وسار العديد من صناع عنونة المدونات النحوية ذي التمثيل الاعت‌ادي على ce‏ 


(1) Habash, N & Farag, R & Roth, R. (2009). Ibid. P.126. 
(2) Nugues, P.M. (2014). Language Processing with perl and prolog. second Edition. 
springer.P.199. 


(3) Haji'c, J & Ciaramita, M & Johansson, R. et al,. (2009). The CoNLL-2009 Shared Task: 
Syntactic and Semantic Dependencies in Multiple Languages In Proceedings of the 13th 
CoNLL-2009, June 4-5 , Boulder, Colorado. 
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هذه الطبعة 
إهداء من المركز 


ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


هيكلة كنل؛ للمشاركة بمدوناتهم النحوية في هذا المؤتمر العالي» فضلا عن أنها أشبه ما 
تكون بصيغة عالمية موخدة. 

وقد تختلف صيغة تنسيق البيانات - من حيث عدد الأعمدة التي تنتهجها المدونات 
المعنونة - من عام لآخر حسب ادف الذي ينشده المؤتمر كل igle‏ إلا أن هناك صيغة 
شائعة تشتمل عل عشرة آعمدة رما كانت كافية لاحتواء جل الدونات النحوية دى 
التمثیل العلاقي باختلاف آهدافها. 

ویوضح الجدول رقم ۳۰ هيكلة كنل لوحدات ila‏ "وقال رود لارسن متحدثا 
للإذاعة العامة النرويجية أنه یمکن الآن تشبیه النطقة من عدة نواح بالبارود المشتعل“. 
القتبسة من بتك کولومییا الاعتمادي X. CATIB‏ 


۲5 F4 Functions Relations F3 2 POS F1 Word ID 


1 و+ 5 PRT‏ | ار 2 MOD‏ ا 
2 قال _ | MEM --- 0 |] | VRB‏ 
3 | رود | "m SBJ 2 | _ | PROP‏ 

"uu --- 3 _ | _ | PROP | _ | Se 
MOD 2 _ | | NOM | _ | متحدثا‎ | 5 
اس‎ MOD 5 _ us. | PRT 5 ل+‎ 6 
PENES OBJ 6 _ | PROP | _ | لاذاعة‎ | 7 
02 MOD 7 _ | _ | PROP | _ | العامة‎ | 8 
"AM MOD 7 _ | _ | PROP | _ اوه‎ 9 
"UD OBJ 2 susp PRT " ol 10 
eM SBJ 10 2 | _ | NOM | — +a | 1 
TN PRD 10 FEN best _ | يمكن‎ | 2 
"DA MOD 12 _ | ار‎ NOM ۱ _ الآن‎ | 3 
رس بت‎ SBJ 12 — | _ | NOM | _ | تشبيه‎ | 4 


(۱) قد طلبت من الأستاذ الدکتور نزار حبش - أستاذ معالجة اللغات الطبيعية بجامعة نیویورك آبو ظبي - أن پرسل لي 
عينة من مدونتهم الوصفة نحويًا للاطلاع عليهاء فأرسل لي هذا النموذج » له جزیل الشکر. 


-۱۷۰- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


F5 F4 Functions Relations F3 F2 POS F1 Word ID 


| IDF 14 _ | | NOM | _ | لمنطقة‎ | 5 
_ | | MOD 14 0] | PRT | — من‎ | 6 
"ID OBJ 16 _|_ | NOM | | ale | 7 
| NM IDF 17 | _ | NOM | _ | واح‎ | 8 
_ | _ | MOD 14 | [| R | _ | بپ+‎ | 9 
_ | . |. MOD 19 _ | _ | NOM | _ | البارود‎ 20 
_ | ١ MOD 20 | [NOM | | | Je | 21 


امحدول:۳۰ من عنونة بنك کولومبیا الشجري 
فالعمود الأول يُعنى بالوصف الترتیبی لوحدات الجملة» آما الثاني فیعرض وحدات 
الجملة نفسها في ترتیب alil «DU‏ تن الأقسام الكلامية التبعة في التحلیل 
والسابع يعرض العلاقات بين التابع والمتبوع في صورة رقمية» والثامن يعرض نوع 
العلاقة لكل وحدة في الجملة» بين| الأعمدة الخمسة (الثالث والخامس والسادس والتاسع 
والعاشر) خالية من السمات cFeatures‏ ]5 يتناول بنك كولومبيا هس أعمدة فحسب. 
وبتحويلها للشكل الشجري: 


شكل ۳۰: تمثيل البنية الشجرية لمثال من بنك کولومبیا الشجري 


2۳ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


۳-۱-۳ التمثيل النحوي بين المكونية والاعتمادية 

لقد آصبح التمثيل المكوني والاعتمادي من وجهة نظر حاسوبية وجهين لعملة 
واحدة» فكلاهما يعرضان النظام الكلي للغة لكن بطرق مختلفة» بل يتحدد معيار 
التفاضل ces‏ عند تلك الوجهة في مقدرة أحدهما على توفير المعطيات اللغوية اللازمة 
للفهم الأتوماتي للنصوص اللغوية» آما من وجهة النظر اللغوية فكانت الفلسفة اللغوية 
ÉL‏ للتمييز والتنظير لکلیهیا. وثمة فروق بين التمثيلين يوضحها الجدول رقم ۳۱: 


يعتمد في بنائه على عقود المركبات أو 


العبارات. 
تظهر فيه الکلات کعقد نهائية والرکبات کعقد 
تظهر الوظائف النحوية والدلالية غالبا 
- على عقود الرکبات. 


يظهر فيه - غالبا - الفعات الفارغت وكذلك 
الإشارة المرجعية للضمير. 
يتم نظمه من خلال الأقواس الرياضية. 
تعبر عن العلاقات بين أجزاء الجملة بالمركبات 
الفعلي»...) 


يعتمد في بنائه على الكلمات والعلاقة بينها 
وبين الكلمة الرأس. 


تظهر فيه الكلمات كعقد نبائية فقط . 


تلو psi cate‏ رال لاله e‏ 335 
الکلات. 
as NY‏ تال سارت aliis e M‏ 
الاشارة المرجعية للضمر. 


يتم نظمه من خلال الصفوف والاعمدة. 


تعبر عن العلاقات بين آجزاء الجملة التمثلة في 
ee‏ بالارقام الاعتادية. 


امحدول:۳۱ فروق بين التمثیل المكوني والتمثیل الاعتم‌ادي 
۱-۳-۱-۳ تحویل التمثیل المكوني إلى الاعتيادي والعکس 
یقصد بالتحویل نقل توصیفات Annotations‏ بنية الکونات إلى بنية الاعت‌ادیات أو 
العکس GT‏ بحيث يتم التعبیر عن الحتوی نفسه في التمثيل الحول إليه."“ ولا شهد 


(1) Rambow, O. (2010). The Simple Truth about Dependency and Phrase Structure 
Representations.Human Language Technologies: The 2010 Annual Conference of the North 
American Chapter of the ACL, Los Angeles, California. 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الدرس النحوي في بداية العقد الأول من القرن ا حالي تطوّرًا كبيرًا في التحليل الاعتمادي 
Dependency Parsing‏ + فقد U‏ الباحثون إلى تحويل التمثيل المكوني إلى اعتمادي في 
الوقت الذي ارتکزت فيه التحلیلات النحوية للعدید من اللغات على بنية الکونات. 

ویقتضی التحویل التبصّر الجيد في البادی التوجيهية Guidelines‏ لتحلیل بنية 
add‏ یل اف ثم تحديد ادف من كلا التمثيلين؛ لتلمّس مواضع التوازي 
Mapping‏ بين العطیات النحوية في التمثيلين التي ينطلق منها في بناء الخوارزميات 
اللازمة للتحلیل الآلي. 


ثمة آسباب قد تعوق عملية التحویل من بنية الصدر إلى بنية ادف منها: © 


© ذا كان الصدر يحتوي على معلومات نحوية آقل من الحد الطلوب في بنية امدف» 
على سبیل الْثال التحویل من بنية مکونات لا تيز بين حرف الجر والأداة إلى iz‏ 
الاعتماديات» em‏ ستودي إلى خلل في تعيين بعض العلاقات بين آجزاء الجملة. 


© إذا كانت بنية الصدر غير متسقة أو غير حكومة بنظرية نحوية. 

ويرى أون رامبو Owen Rambo‏ أن التحويل من بنية المكونات إلى بنية الاعت‌ادیات 
أكثر سهولة من بنية الاعت‌ادیات إلى بنية المكونات» في حين التحويل من الاعتمادیات إلى 
المكونات يكون أكثر إفادة لتقنيات التعلم الآلي. O‏ 

وقد تعددت الأدوات الحاسوبية في هذا المضار لتحويل بنية الکونات إلى iz‏ 
الاعتماديات» ومع ذلك لا تصلح لكافة التحویلات في هذا الإطار إلا بتغيير المتغيرات 
۵5 التي تخضع للهدف النشود. ومن هذه الادوات: 

© Penn Converter حول بنك بنسلفانيا‎ - ١ 

وقد طورت وحدة تقنية اللغة Language Technology‏ بجامعة لاند هذه el I‏ 
لتحويل البنية المكونية الستخدمة في نمط بنسلفانيا إلى أشجار الاعتادية للغة الإنجليزية 
في صيغة تنسيقات كنل ۰۲۰۰۸۰۲۰۰۷ ۲۰۰۹. وقد كتبت بلغة جافا java‏ البرمجية» 


(1) Rambow, O. (2010). Ibid. 
(2) Rambow, O. (2010). Ibid. 


(۳) یمکن تحمیل الأداة من خلال هذا الرابط: 
treebank converter. (2007). http://nlp.cs.Ith.se/software/treebank converter‏ 
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هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


مدعمة العدید من بيئات التشغیل MS Windows, UNIX Distributions‏ . 
-Y‏ النسق من المكونية إلى الاعتادية ‘Constituency to Dependency Mapper‏ 
وقد طوّر الدکتور نزار حبش هذه الأداة أثناء بنائه لبنك کولومبیا الاعت‌ادي 
48 ؛ وذلك لتحویل بنك بنسلفانیا المكوني ATB‏ إلى النهج الاعتمادي. وقد کتبث 
هذه الاداة بلغة بيرل Perl‏ البرمجية» مدعمة العدید من بيئات التشغیل MS Windows‏ 


. , UNIX Distributions 

ویمکن توضیح عملية التحویل من خلال عرض الثال الرفق مع الاداة: 

"اطلع النائب العام التمييزي عدنان عضوم على التحقیقات الجارية في حادث 
اختفاء الهندس في التنظیم الدني ودیع ul‏ راشد قبل آربعة آيام. وآفادت مصادر مطلعة 
على التحقیق أنه يجري التوسع فيه مع ثلاثة عناصر من قوی الأمن الداخلي احيلوا على 
مفرزة التحري لاستيضاحهم طبيعة العلاقة التي تربطهم بالختفي." جريدة النهار. 


(S 
(VP (PV-PVSUFF SUBJ:3MS ATIE) 
(NP-SBJ 
(NP (DET-NOUN-CASE DEF NOM AlnA]b) (DET+ADJ+CASE DEF NOM AlEAm) 
(DET-ADJ4CASE DEF NOM Altmyyzy)) 
(NP (NOUN PROP EdnAn) (NOUN PROP EDwm))) 
(PP-CLR (PREP ElY) 
(NP 
(NP (DET-NOUN-NSUFF FEM PL4CASE DEF GEN AltHqygAt) 
(DET-ADJ-NSUFF FEM SG+CASE DEF GEN AljAryp)) 
(PP (PREP fy) 
(NP (NOUN-CASE DEF GEN HAdv) 
(NP 
(NP (NOUN-CASE DEF GEN AxtfA') 
(NP 
(NP 
(NP (DET-NOUN-CASE DEF GEN Almhnds)) 
(PP (PREP fy) 
(NP (DET-NOUN-CASE DEF GEN AltnZym) 
(DET-ADJ4CASE DEF GEN Almdny)))) 
(NP (NOUN PROP wdyE) (NOUN PROP Aby) (NOUN PROP 


rA$d)))) 
(NP-TMP (NOUN-CASE DEF ACC qbl) 
(NP (NOUN NUM-NSUFF FEM SG4*CASE DEF GEN ArbEp) 
(NP (NOUN-CASE INDEF GEN AyAm)))))))))) 
(PUNC .)) 


شکل :۳۱ نموذج من بنك بنسلفانیا! (e‏ 


(۱) یمکن تحمیل الأداة من خلال هذا الرابط: 
C2D-v0.7. (2009). http://wwwl.ccls.columbia.edu/-habash/C2D-vO0.7.tar.gz‏ 


(Y)‏ تنتهج مؤسسة شبكة البيانات اللخوية نظام باكولتر في ترمیز الحروف العربية. 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


وتظهر نتيجة التحويل من التمثيل المكوني إلى التمثيل الاعتمادي بهذا الجدول: 


1 ATIE VRB 0 --- [WORD:ATlE,LEXEME:,VVRB/ 
VBD/PV«-PVSUFF SUBJ:3MS] 
2 AlnA)b NOM 1 SBJ [WORD:AlnA) 
b,LEXEME:,DASHTAG:SBJ,NOM/DT-*NN/DET«NOUN4*CASE DEF NOM] 
3 AlEAm NOM 2 MOD [WORD:AlEAm, LEXEME:,NOM/ 
DT-JJ/DET-ADJ-*CASE DEF NOM] 
4 Altmyyzy NOM 2 MOD 
[WORD:Altmyyzy, LEXEME:,NOM/DT4*JJ/DET-ADJ4*CASE DEF NOM] 
5 EdnAn PROP 2 MOD [WORD:EdnAn, LEXEME : , PROP/ 
NNP/NOUN PROP] 
6 EDwm PROP 5 --- [WORD: EDwm, LEXEME : , PROP/ 
NNP/NOUN PROP] 
7 ElY PRT 1 MOD [WORD:ElY,LEXEME:,DASHTAG 
CLR, PRT/IN/PREP] 
8 AltHqyqAt NOM 7 OBJ 
[WORD:AltHqyqAt, LEXEME:,NOM/DT-NNS/DET-NOUN-NSUFF FEM _ 
PL-CASE DEF GEN] 
9 AljAryp NOM 8 MOD 
[WORD:AljAryp, LEXEME:,NOM/DT-*JJ/DET-ADJ«*NSUFF FEM 
SG+CASE DEF GEN] 
10 fy PRT 8 MOD [WORD: £y, LEXEME : , PRT/IN/ 
PREP] 
11 HAdv | NOM 10 OBJ [WORD: HAdv, LEXEME : , NOM/NN/ 
NOUN-CASE DEF GEN] 
12 AxtfA' - NOM 11 IDF 
[WORD:AxtfA',LEXEME:,NOM/NN/NOUN-*CASE DEF GEN] 
13 Almhnds NOM 12 IDF 
[WORD:Almhnds, LEXEME:,NOM/DT-NN/DET-NOUN«*CASE DEF GEN] 
14 fy PRT 13 MOD [WORD: fy, LEXEME : , PRT/ IN/ 
PREP] 
15 AltnZym NOM 14 OBJ 
[WORD:AltnZym, LEXEME:,NOM/DT-NN/DET-NOUN4*CASE DEF GEN] 
16 Almdny NOM 15 MOD 
[WORD:Almdny, LEXEME : , NOM/DT+JJ/DET+ADJ+CASE DEF GEN] 
17 wdyE PROP 13 MOD [WORD:wdyE, LEXEME : , PROP/ 
NNP/NOUN PROP] 
18 Aby PROP 17 --- [WORD:Aby, LEXEME : , PROP/ 
NNP/NOUN_PROP] 
19 ۲۸50 PROP 18 --- [WORD: rA$d, LEXEME : , PROP/ 
NNP/NOUN PROP] 
20 991 NOM 12 MOD [WORD:qb1, LEXEME:,DASHTAG: 
TMP,NOM/NN/NOUN-CASE DEF ACC] 
21 ArbEp NOM 20 IDF [WORD:ArbEp,LEXEME:,NOM/ 
NN/NOUN NUM-NSUFF FEM SG4CASE DEF GEN] 
22 AyAm NOM 21 IDF [WORD:AyAm, LEXEME : , NOM/NN/ 
NOUN-CASE INDEF GEN] 
23 PNX 1 MOD [WORD:.,LEXEME:, PNX/PUNC/ 
PUNC] 

احدول:۳۲ التمثيل الاعتہادی المحول إليه من التمثيل الکونی 


- ۱۱/۵ 


هذه الطبعة 

إهداء من المركز 

ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


۲-۳ الحتوی النحو ي Syntactic Content‏ 

يشير مصطلح الحتوی النحوي إلى العطیات النحوية التي آنتجتها الیتا - لغة 
Meta Language‏ من خلال التجرید والتوصیف للظاهرة اللغوية؛ لتشمل القولات 
والکونات والرموز التي تعبّر عن القواعد والعلاقات النحوية» والتي یتعذر بدونها 
قثیل النظرية النحویة» کا لا بمکن - أيضًا- أن شل وحدها دون نظرية نحوية لکن 
یمکن أن نشب إليها فحسب آثناء العملية التعليمية, ^ 

وقد كان لعلائنا اللغويين والنحویین القدامی فضل السبق في وضع منظومة رمزية 
لوصف القواعد والعطیات النحوية وقد بثوها في متونهم وکتبهم النحوية» ومع ذلك 
لم نجار هذه الأسبيقة إزاء الانفجار التنظيري بل التزمنا الصمت تجاه التنظير اللغوي 
امحدیث. ویعبر الدکتور نبیل على عن أزمة تنظیرنا النحوي الان بقوله" ولا نذیع 
سرا بقولنا إن لغة وصف اللغة العربية قد تبرت وتخلفت حتی على مستوی الفاهیم 
الأساسية» مثل مصطلح النحو والترکیب*. 

”يلجا النحو العام بحکم طبیعته الشاملة إلى التجرید ویمیل إلى استخدام عدد حدود 
من الرموز والااصطلاحات حيث تزداد قوة التنظير» ووجاهته. كلما صبحت " لغة 
وصف اللغة" آکثر تقیدا وتجریدا فكلا توسعنا في استخدام الرموز والاصطلاحات؛ 
وتمادينا في تفریعاتنا وتصنيفاتناء تاه في تفاصیلها لب الظاهرة النحوية» وتقلصت قدرتنا 
على وضع اليد أو القبض على عمومیاتها وكلياتها. 0( 

وتتقيد الدونة اللغوية المعنية بالتحليل أو بالوصف للعلاقات التركيبية بعدد محدد 
من المعطيات النحوية 138561 التي تخضع للهدف المنشود من البناء» كا تتقيد العطیات 
بنوع التمثيل المتوخي في التحلیل» إذ يقتضي التمثيل المكوني معطياتِ حول الوحدات 
المكونة للجملة التي لا يتطلبها التمثيل الاعتمادي» ويقتضي التمثيل الاعتمادي بیان 
العلاقات النحوية الممثلة التي قد لا يقتضيه التمثيل المكوني. 

(1) Rambow, 0. (2010). Ibid. 

YE علي (نبیل)» حجازي» (نادیة): الفجوة الرقمی ص‎ (Y) 


WEM ۰۲۳ (نبیل): اللغة العربية والحاسوب» ص۲۱‎ «Je (Y) 


-1 ۷ب 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


وتتمحور جل المعطيات النحوية التي تم بها توصيف العديد من اللغات. حول ما 
e‏ 

- السات التركيبية Syntactic Tagset‏ وتشتمل على علامات لانواع احمل. 
وآنواع الرکبات أو الوحدات المكونة للجملة. 

- السیات الوظيفية Functional Tagset‏ وتشتمل على علامات للوظائف النحوية 
والدلالية والتداولية للوحدات أو الکونات. وكذلك خواص آجزاء النصوص. 

- الاشارات الشترکة Co-Indexing‏ لتمییز الرکبات أو الوحدات الاسمية 
بعلامات محددة في الجملة. 

- الفصائل الفارغة Empty categories‏ وتشمل علامات للض‌اثر أو الأسماء أو 
المكونات المحذوفة في الجملة. 


۲-۳ النظرية النحوية The syntactic theory‏ 
النظرية هي " مجموعة متجانسة من البادی والاسس والقواعد التي ینتظمها مفهوم 
مستوعب للکلام وآحکامه قادر على إيصال الدلالات الصحيحة للمخاطب“" 
وتنطلق هذه البادی من تمثيل العنی فى إطار العطیات النحوية التی تعد خصائص ile‏ 

ف ias‏ من اللغات آو ف اللغة العينة. ۱ 

وتجدر الاشارة إلى أن اختيار نوع التمثیل النحوي يحدد اتجاهات النظرية التوخاة ما 
بين النظام التحليلي أو التوليدي» حيث یتلام النظام التحليلي مع التمثیل الاعتادي» 
Cs‏ يتلاءم النظام التوليدي مع التمثیل المكوني. 

وتدور النظريات النحوية في فلكين أساسين» فلك يعنى بمبادئ الوصف النحوي 
للغة خصوصة وفلك آخر يعنى بالبادی التفسيرية للظاهرة النحوية في جميع اللغات 
الإنسانية. أو بقول آخرء تدور النظريات النحوية فیما أرساه دي سوسير بجعل اللغة 
ظاهرة زمكانية يمكن وصفها وصفا GT‏ وفيها افترضه تشومسكي حول النحو الكلي UG‏ 
بأنه موجود في أذهان الأطفال منذ الولادة» ويتمثل في مجموعة من المبادئ والمحددات. 

ومن ثم تبلورت النظريات النحوية - في إطار التمثيل النحوي - في نوعين: 


Ael) Rae (Y)‏ مصطفی): النظرية النحوية- المفاهيم والتحدیات. وقائع مؤتمر»العربية وقرن من الدرس النحوي» دار 
العلوم-القاهرة» ۲۰۰۲م ص ۰۱۹۲ 


eye 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
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۱-۳-۳ النظرية الوصفیة: هی ضرب من بیان مبادی طرق انعقاد الربط والارتباط 
بصورة y adl Rast‏ وکذلك بیان موقع الکونات أو الوحدات في ابملة. ویتم 
توظیفها في التمثيلين النحويين من خلال: 

Constituency Structure ås البنية الکو‎ ۱-۱-۳-۳ 

تنطلق النظرية الوصفية في ضوء التمثيل المكوني من النحو التحرر من السیاق"" 
الذي حدده تشومسكي لتوصیف الظواهر اللغوية. 

Context Free Grammar التحرر من السیاق‎ pa ۱-۱-۱-۳-۳ 

هو النظام الرياضي الاکثر شهرةً لنمذجة بنية الوحدات أو الکونات للغة 
الإنجليزية» وللغات الطبيعية الأخرىء وهو ما یعرف ب نحو بنية العبارة Phrase-‏ 
Structure Grammar‏ الذي اقترحه تشومسکی في کتابه التراکیب النحوية,۲۹ 

وتشبه هذه الصورية صيغة باكوس نور Backus-Naur‏ أو BNF‏ من حيث قواعد 
إعادة الكتابة (Qewrite Rules)‏ التي يفترض في صياغتها عدم اعتماد أي عنصر فيها 
على ما يسبقه أو يلحقه من عناصرء أو بقول آخرء ليس له حساسية للسياق النحوي 
الل د 

ويتم صياغة الوحدات أو المكونات النحوية في ضوء عدد من قواعد بنية العبارة 
التي تشترك مع الفئات النحوية؛ لتكوين هذه الوحدات أو المركبات المعبرة عن أركان 
الجملة» ومن هذه الفئات الأساسية: 


Noun الاسم‎ ۰ 


Verb الفعل‎ ۰ 


Adjective الصفة‎ e 
Adverb حال‎ e 
Preposition حرف جر‎ e 


(۱) وتفرعت iae‏ شکلیات formalisms‏ من النحو التحرر من السیاق لوصف بنية الجملة منها: نحو الأشجار 
التجاورة Grammars Tree Adjoining (TAG)‏ نحو بنية المقولات النحوية العتمد على الرأس Head driven‏ 
.Phrase-Structure Grammar (HPSG)‏ والنحو الوظيفى Lexical Functional Grammar „ozal‏ 
(LFG)‏ والنحو المقولي i -Categorical Grammar (CG)‏ ۱ 


(2) Jurafsky, D. & Martin, J. (2007). Ibid. P.433. 
EY علي (نبيل): السابق» ص‎ (») 


= \ VA- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


Determiner أداة تحديد‎ e 

Conjunction رابط‎ e 

ویتم تکوین القواعد من شقين يتخلله| سهمٌ» يمكن أن نعبّر عنهیا بهذه الصيغة 
الرياضية (V9 W‏ حيث ۷ تعني اسم الرکب. آما ۷ فتعنی الاجزاء المكونة لهذا 
الرکب التي قد تکون عبارة عن مرکبات أو مزیج من مرکبات وفئات نحوية» أو فئات 
نحوية فقط .“ ومن أمثلة قواعد صياغة المركبات: 


الرکب الاسمي ‏ اسم + مركب اسمي NP 2N+ NP‏ 
مركب الجر € حرف جر + مركب اسمی PP 2P+ NP‏ 
الم ركب الفعل ‏ فعل + مركب اسمی+ (مرکب جر) VP 2V+NP (PP)‏ 


یلاحظ في صياغة هذه الرکبات أن لكل مركب Head UT,‏ يميزه» ومکملا 
Complement‏ يتممه» على سبيل المثال» eS AU‏ الاسمي رأسه الاسم» والمركب 
الفعلي رأسه الفعل» ومركب الجر رأسه حرف ار بيا المكمل هو الأخت لرأس 
المركب في التمثيل الشجري» ويوضح الشكل رقم ۳۲ القوانين الشكلية لتنظيم قواعد 
بنية العبارة أو قواعد النحو التحرر من السياق: 


(1) Jurafsky, D. & Martin, J. (2007). Ibid. P.434. 


-Wa- 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


شکل:۳۲ الخطط التنظیمی لقواعد بنية العبارة 


يجمع هذا الشكل القوالب التنظيمية لصياغة احملةه حیث يحدد المحدد Specifier‏ نوع 
الرکب الذي يوازيه في التنظيم» ”وهو في الغالب يقدم معلومات أكثر عن الرأس أو أن 
pae‏ الرأس أكثر Oa‏ بيغا الوصف Adjunct‏ هو نوع من المركبات يصف رأس 
المركب» والکمل COMP‏ هو الأقرب للرأس. وهذه القوالب كانت المحكٌ الأسامى في 
طهور تظریة esa DX bar Jes‏ لباریف fond]‏ ررس ait e‏ وه 
العبارة وتحديدها في ضوء تلك القوالب أو ما تسمى PSE‏ 

لا يتم هذا التنظيم في صياغته للجملة إلا في ضوء المبادئ أو الأحكام التركيبية 
المقيدة ببنية العوامل Predicate-argument Structure‏ التى تعادل في جوهرها نظرية 
العامل O, e poc‏ ۱ 

ویتضح تنظیم قواعد النحو التحرر من السیاق في ضوء الأحكام التركيبية القيدة 
ببنية العوامل في الثال التالي الذي آثرت فيه أن یکون له آکثر من صورة؛ لیتضح التمییز 
بين التمثیلات الختلفة. 


YE بوول (جيفري): النظرية النحوية» ترجمة د.مرتضی باقر النظمة العربية للترجمة» ط ۲۰۰۹۰۱م ص‎ CO 
(2) Babby, L. (2009). The Syntax of Argument Structure. Cambridge University ۰ 


sra 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الشکل:۳۳ مثال على تنظيم الأحكام التركيبية المبنية على المعنى في إطار النحو التحرر من السياق 

يلاحظ في التمثيلين النحويين الأحكامَ التركيبية المبنية على المعنى» ففي الشكل 
الأول نجد أن مركب الجر PP‏ هو وصف لرأس المركب الاسمي NP‏ ”ولدا“ 
وهذا يعني أن النظارات صفة ملازمة للولد» UT‏ الشكل الثاني فنجد أن مركب الجر 
PP‏ هو مكمل لرأس المركب الفعلي VP‏ ” رآيت“» وهذا يعني أن النظارات 
ملازمة للرائي. 

Dependency Structure البنية الاعت‌ادية‎ ۲-۱-۳-۳ 

تنطلق النظرية الوصفية في ضوء التمثیل الاعتيادي من النحو التقليدي القائم على 
الأحكام التركيبية القيدة بفكرة العامل والعمول أو الوضوع والحمول ولعل أصدق 
مثال على ذلك ما صنعه فریق معالحة اللغات الطبيعية بجامعة لیدز من بناء مدونة 
للنص القرآني معنونة بالعلاقات التركيبية ذي التمثیل الاعتمادي. 


(۱) یلاحظ عدم عنونة رأس الرکب الفعلي برمز ۷ إذ لا يوجد احتمال آخر لنوع هذا ال رس غير الفعل أو شبه 
الفعل أو ما يقوم مقامه بعکس الرکبات الأخرىء كا أن توصیف الفعل يحتل نصيبًا في عنونة الأقسام الكلامية» فلا 
داعى للتكرار هنا. 


eA 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


Chapter (63) sürat l-munafiqun (The Hypocrites) 


We have provided you what from And spend 


b 

— fn Cu 
۱ 

^ 
s 

۳۹ 


الشکل:؛ ۳ نموذج بنية الاعتمادية «للنص Cc f AI‏ 


۲-۳-۳ النظرية التفسم ية: 

«هي جموعة البادی النظمة التي ینبغی أن یلحظها البحث اللساي من حيث هي 
مشترکة بین اللغات وتلتزم بها اللغات». © وهي ا س الق اک ال أو الحو 
الكلي الذي يقوم على المبادئ العامة General Principles‏ المشتركة بين آنحاء اللغات. 
ويتم توظيفها - أيضًا - في التمثيلين النحويين من خلال: 


۱-۲-۳-۳ البنية المكونية Constituency Structure‏ 
تتطلق النظرية التفسيرية في ضوء التمثيل المكوني من نظرية السين البارية التي 
اقترحها تشومسكي”" بعد مرور خمسة أعوام من مؤلفه الأول بهدف إعادة صياغة البنية 
التكوينية لقواعد بنية العبارة؛ لتحديد التعمييات التي تحكم الفعات الداخلية لجميع 

اللغات الانسانية. 


)١(‏ یمکن الاطلاع على الدونة القرآنية الوصفة من خلال هذا الرابط: 

Quran Syntax. (2007). http://corpus.quran.com/treebank.jsp 

(Y)‏ زکریا؛ (میشال): الألسنية التوليدية وقواعد اللغة العربية (النظرية الألسنية)» ط CY‏ الوسسة الجامعية للدراسات 
والنشر والتوزیع» بیروت» ۰۱۹۸ ص NV‏ 

e Avv Jackendoff م» ولیمندز ۲15700005 ۱۹۷م وجاکندوف‎ ۱۹۷٦ Bresnan قد عاد كل من بریزنان‎ (Y) 
صياغة هذه النظرية بطرق مختلفة. ینظر: زفارت (جوست): البنیات التركيبية والبنیات الدلالية» علاقة الشکل بالعنی.‎ 
YOYE ترجمة د.عبد الواحد خبري» ط ۰۱ دار احوار للنشر والتوزیم» سورياء ۲۰۰۸ م» ص‎ 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


X-bar Theory نظرية السين البارية‎ Y- Y- Y-Y'-Y 
تفترض هذه النظرية وجود ملامح تركيبية مشتركة بين جميع اللغات الانسانية‎ 
بناءٌ على افتراضیات وجود نمط معين منشأ بالذهن البشري وقد عبّر تشومسكي عن‎ 
آنساق هذه اللامح التركيية - من خلال هندسة التوازي بين الذهن والنحو - بتعیینه‎ 


للمبادی والحددات اللغوية. 
وتتمثل البادی اللغوية الحاكمة للمکون التركيبي في التمثیل الشجري في مبدآین 
اشاش 


.(Headedness Principle) مبد الرأسية‎ - 

كل عقدة غير اة ف البنية التركييية ثل إسقاطًا لرأس AI‏ 

.(Binarity Principle) مبداً الثنائية‎ - 

كل عقدة غير نهائية Non-Terminal‏ في البنية التركيبية تکون ذات تشعب ثنائى. 
وبذلك يتم التخلص من الأبنية المسطحة Flat Structures‏ التي تظهر في صياغة قوانين 
بنية العبارة التي أرساها تشومسكي في كتابه البنى التركيبية عام YA‏ م. 

وني ضوء هذه المبادئ» تتحدد القوالب التنظيمية لصياغة قوانين بنية العبارة في 
إطار المحددات Parameters‏ العامة" التي تشمل جميع اللغات الإنسانية» ومن هذه 
القوالب أو القوانين العامة": 

The Specifier Rule قانون المحدد‎ -۱ 

یتکون الرکب XP‏ (حيث تعنی × أو س الفئة القولية مثل الاسمء الفعل؛ 
الصفة ...) من حدد اختياري Spec‏ ( مثل أل التعریف. وحروف العطف. و ضاثر 
الوصلء ...) وس شرطة CX)‏ مع إمكانية تبدیل الواقع ما بين الحدد وس شر طقف 
حيث تختلف اللغات فيا بینها في مواقع تواجد هذه الاجزاء. 


(1) Radford, A. (2009). An Introduction to English Sentence Structure, University of Essex. 

P.43. 

(Y)‏ یقصد بالحددات العامة هنا الإحاطة بقیود الرتبة التركيبية في اللغات الانسانية؛ لذا سنجد في القوانین إمكانية تبدیل 

الواقع بين الحدد وسين شرطت وبين الوصف ورأس الرکب. وبين الکمل والرأس؛ لتختار کل لغة الحددات الخاصة 

بها عند التحلیل. على سبیل JA‏ مرکبات الوصف Adjunct‏ يمكن أن تأتي في اللغة الانجليزية على يمين الرأس ویساره» 
وكذلك في العربية إذا كان مركب الوصف حالاء أما إذا كان صفة فتأتي بعد الرأس. 

(3) Radford, A. (2009). Ibid. P.13. 


eA 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


XP ÈX’ (Spec) أو‎ XP (Spec) X‘ 


3 2d 


Spec x' 4 Spec 


الشکل:۳۵ التمثيل الشجري لقانون الحدد) 

The Adjunct Rule قانون الو صف‎ -Y 
هذا القانون لایضاح وصف رأس الرکب. كما یتموقع هذا الوصف (مرکب‎ Gb 
الصفة. مركب ال حال» مركب الجر غير الکمل»...) على يمين أو يسار الرأس التمثل في‎ 

السين شرطة أو × وذلك لاختلاف مواقع الوصف في اللغات. 
 'X'2Adjunct X‏ أو X’ >X’ Adjunct‏ 


X' Adjt ` Adjt X 


الشکل :۳۹ التمثيل الشجر ي لقانون الوصف”) 


The Complement Rule قانون المكمل‎ -Y 
هذا القانون لایضاح مکمل رأس الرکب الذي يتمثل في الفعول به الباشر‎ gi 
وغير المباشر» والمضاف إليه» وتمييز العدد»...» ويتموقع هذا المكمل - أيضًا - على یمین‎ 

واش ال رکب ویساره التمثل فی السين أو X‏ 


(1) Koopman, H & Sportiche, D & Stabler, E. (2003). An Introduction to Syntactic Analysis 
and Theory . UCLA. P.125. 


(2) Koopman, H. & Sportiche, D. & Stabler, E. (2003). Ibid. P.125. 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


X’ > Complement X أو‎ — X' 2X Complement 


آو 


X Com p Co m p 3 


الشکل:۳۷ التمثيل الشجري لقانون الکمل V‏ 

ويقتضي تنظیم هذه القوالب التنظيمية أو القوانین العامة Sie VE‏ على الافکار 
العامة للغات الإنسانية: مثل الموضوع والمحمولء والمسند والمسند إليه وغيرها من 
الخصائص العالية للغات.” وهذا يؤكد ما لا يدع Vue‏ للشك أن هناك اتفاقا GG‏ 
ين النحو التحرر للسیاق ونظرية السین البازية في اعتادهما غل الوضوع والحمول 
في تنظیم القوالب لصياغة الجملة» لکن الفارق الوحید بینهما في طريقة صياغة تلك 
القوانین التولیدیة. حیث كانت القوانین في النحو التحرر من السیاق كثيرة جذاء كا 
تختلف من لغة لاخري حسب رتبة الکلیات في الجملة» eas‏ في نظرية السین البارية 
محددة dae‏ وتحتوي كل اللغات الانسانية مع اختلاف بعض الحددات Parameters‏ 
من لغة لأخرى. 

وباختيار المحددات Parameters‏ الخاصة للغة العربية» يمكننا أن ORB‏ تنظيم 
القوالب - في ضوء الأحكام التركيبية القيدة بالعامل والعمول - في لغتنا العربية» وقد 
عمدت إلى اختيار المثال نفسه الذي أجريت عليه قواعد النحو المتحرر من السياق في 
ضوء الأحكام التركيبية؛ ليتضح الفارق بينهما في صورة تمثيلية. 


(1) Koopman, H. & Sportiche, D. & Stabler, E. (2003). Ibid. P.125. 
1۲-1۱ البنهساوي (حسام): نظرية النحو الكلي والتراکیب اللغوية العربية» مکتبة الثقافة الدينية» ۲۰۰۶م» ص‎ )۲( 
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هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


نظارات نظارات 
الشکل :۳۸ مثال على تنظیم الأحكام التر كيبية البنية على العنی في إطار نظرية السین البارية 
وبملاحظة الصورة الأولى للمثال نجد أن مركب الجر 27 في موضع الوصف لرأس 
المركب الفعلی» حيث إنه بنت ل ۷“ enl,‏ ل ۷“ في التمثيل الشجري؛ ليدل على أن 
النظارات صفة ملازمة Gl c D‏ ق الصورة الثنية للمثال نجد آن مرکب اضر ۳ فى 
موضع الکمل لرأس الرکب. حیث إنه بنت NJ‏ وأخت ل N‏ في التمثیل الشجري؛ 
Ja‏ على أن النظارات ملازمة للرائي. 


۲-۳-۳-۳ البنية الاعتمادية Dependency Structure‏ 
تنطلق النظرية التفسيرية فى ضوء التمثیل الاعتادى من النظرية الاعت‌ادیة الى 


(۱) تفرعت العدید من الشکلیات formalisms‏ من نظرية تنيير الاعتمادية» منها: نحو الكلمة Word Grammar‏ 
(WG)‏ والوصف التوليدي Functional Generative Description (FGD) Ab JI‏ ونظرية نص العنی 
.Meaning- Text Theory (MTT)‏ والنحو العلاقي -Link Grammar (LG)‏ 


ses 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


يعود بزوغها إلى اللغوي الفرنسی لوسيان (L.Tesnière) ps‏ في كتابه عناصر النحو 
الترکیبی “1959 "Eléments de Syntax Structurale, Paris‏ الذي اتخذ صورته 
النهائية بعد دراسات سابقة في هذه المجال» ویعد هو الرتکز الفعلي لاسس نظرية الحو 
Mad di‏ : 


Dependency Theory نظرية الاعت‌ادية‎ Y- Y-Y-Y-Y 
ترتکز هذه النظرية على مبادی عامة تشترك فیها جميع اللغات الانسانية؛ لاقامة‎ 
نموذج نحوي یسایر كل الأنظمة اللغوية الختلفة من حیث انتظام عناصر الجملة في‎ 
قالب محدد من العلاقات. وتتمثل هذه البادی بشکل عام في تحديد الرژوس التركيبية‎ 
باعتبارها حاكمة لکملاتها أو توابعهاء ويحتل الفعل قمة العناصر الحاكمة في الجملة.‎ 
وتتدرج الاعت‌ادیات من قمة الفعل باعتباره المؤثر الأقوى في تأليف نواظم الكلم‎ 
إلى العناصر الأساسية المباشرة له» ثم من تلك العناصر إلى عناصر تتبعهاء وهكذا.أما‎ 
إذا لم يكن الفعل موجودا في بنية الجملة» فإن المركب الاسمي وحده قادر على أن يبني‎ 

جملة يطلق عليها الجملة الاسمية من خلال مركزية الاسم في المركب." 

وقد تبلورت العموميات اللغوية الاعتمادية بشكل تطبيقي على يد اللغوية ماري 
کاثرین دي مرنف Marie-Catherine de Marneffe‏ آستاذة اللغویات بجامعة ولاية 
آهاویو Ohio State University‏ بالولایات التحدة الأمريكية» حيث مکنت من 
إقامة نموذج نحوي موحد یتناول طرق تمثيل العلاقات النحوية في البنية الاعتمادية 
في جیع اللغات الانسانية مع تقدیم بعض الحددات Parameters‏ التي تختلف فیها 
بعض اللغات. وکان ذلك إثر استقصائها للعلاقات النحوية في اللغة الانجليزية؛ 
لاستخدامها آنذاك في اعتادیات ستانفورد التي كانت تهدف إلى تطبیقات فهم اللغة 
الطبيعية Natural Language Understanding (NLU)‏ مثل الحللات النحویت 
الترجمة الآلية» وإجابة الأسئلة» والحاورة مع الحاسوب» وغیرها من التطبيقات. " 


Moe ۱۹۸۸ 1١ بحيري(سعید حسن): نظرية التبعية في التحلیل النحوي.مكتبة الأنجلو المصرية»‎ )۱( 
M السابق» ص‎ )۲( 
(3) Marneffe, عل‎ & Dozat, T. & Sliverira, N. et al., (2014). Universal Stanford Dependencies: 
A cross-linguistic Typology. In Proceedings of 9th International Conference on Language 
Resources and Evaluation (LREC 2014). 
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هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


OUS y‏ للنموذج النحوي الذي وضعته ماري مرنف آثر بالغ في اللسانیات الحاسوبية 
لا سی| التحلیل النحوي Syntactic Parsing‏ فقد انطلق منه جوكايم نیفر» وریان 
ماکدونالد وغیرهم في بناء مشروع P‏ الاعق‌ادیات العالية Universal Dependencies‏ 
(UD)‏ لعنونة اللغات الانسانية بمنهجية اعتمادية موحدة؛ هدف بناء محلل نحوي 
متعدد اللغات من أجل توحيد دقة النتائج التحليلية بين اللغات الختلفة؛ وذلك 
لتحسین نتائج الترجمة الالية.() 

وقد تضمن هذا الشروع إلى الآن مان وعشرین لغة”"» تتصدرهم اللغة الانجليزية 
والالانية والسويدية والصينية والعبرية» وتخلو منها اللغة العربية للأسف الشدید بسبب 
إغفالنا التام عن النظریات اللغوية الحديثة واللغویات الحاسوبية والمعرفية» وغیرها من 
مقتضیات عصرنا النهضوي. ولا نبالغ بقولنا إن قدرة لغتنا العربية على اللحاق برکب 
الثورة المعرفية» ومواجهة العولة التي تغارس عليها ضغوطًا بسبب السیل العلوماتي 
الجارف رهن le‏ یمکن إنجازه على صعيد معالجتها f‏ 

ولا كان هذا المشروع العالمي يخلو من لغتنا العربية» فقد تخيرت مثالا توضيحيًا 
من مدونة ويب للغة الإنجليزية المعنونة بالاعت‌ادیات العالیة۳؛ مستخدمًا أداة 
Dependency Viewer‏ المفتوحة المصدر للباحث الصينى جوانجشاو Guangchao‏ 
Tang‏ لعرض هذا المثال في هيئة شجرية. ۱ 


(1) McDonald, R. & Niver, .ل‎ et al., (2013). Universal Dependency Annotation For 
Multilingual Parsing. In Proceedings of the 51st Annual Meeting of the Association for 
Computational Linguistics. Sofia, Bulgaria. 
: یمکن الاطلاع على موقع الاعتمادیات العا مية من خلال هذا الرابط‎ )۲( 
.Universal Dependencies. (2014) 
http://universaldependencies.github.10/docs/Zlanguage-u 
: للاطلاع على مدونة ويب العالية للغة الانجليزية من خلال هذا الرابط‎ )۳( 
UD English. (2014). https://github.com/UniversalDependencies/UD English 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


punchline 
9| NOUN 10| PUNCT 
nsubj punct 


الشکل:۳۹ نموذج من مدونة ويب للغة الانجليزية ( في صورة شجریة) 
.Read the entire article : there's a punchline, too‏ 
اقرا المقال کاملا: ثمة روح فكاهية بنهاية النص. 


أو فى هييئة أفقية :Horizontal‏ 


الشکل:۰؟ نموذج من مدونة ويب للغة الإنجليزية ( في صورة أفقية) 


. Read the entire article : there's a punchline, too 


اقر  IJI‏ کاملا: ثمة روح فکاهية بنهاية النص. 
P‏ روح ی ب 
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هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


٤‏ . عنونة الدونة اللغوية - عينة الدراسة - بالعلاقات التركيبية 

لا كان الوصول إلى نظام تحليلي مکتمل الأركان» صارم الاحکام» من حيث عوامل 
التحلیل اللغوي: التمثيل والنظرية والحتوی» يعد أمرًا صعبًا نسبيًا في وقتنا GIH‏ 
لاعت‌اد تلك الأنظمة التحليلية - التاحة - على البادی الافتراضية فحسب دون 
الساس بکل العلوم all‏ فية Cognitive Science‏ التي لما علافة وثيقة باللغة» فقد 
كان لزامًا علینا أن نتوخى إحدى تلك الأنظمة في الکشف عن الأبنية التركيبية في النظام 
اللغوي موضوع الدراسة. 

وتتمثل تلك الأنظمة التحليلية في القيام بدور السوغ للقواعد التركيبية (النحوية) 
عن طريق تقديم معيار أو إجراء تقويمي يمكن عن طريقه أن يتخير العالم اللغوي 
أفضل تلك الإجراءات لتكون صالحة دون سواها في تحليل المادة اللغوية» وليس يعنى 
ذلك أن هذا الاجراء أو المعيار هو وحده الصحيح بصورة مطلقة» لكنه ا 
أفضل الإجراءات في وصف اللغة 5 (LA‏ 

وتتحدد ملامح العنونة بالعلاقات التركيبية للادة اللغوية عينة الدراسة في ضوء 
الأغراض المنشودة من البناء. وقد انطلقت الدراسة من التمثيل المكوني في تعيين 
العلاقات التركيبية لعدة أسباب: 

* الأكثر قثیلا لشكل العرفة اللغرية لاسیا القواعد النحوية في الذهن البشري 
(الفص الصدغي).0) 

© بمثابة البنية التحتية التي تصلح لتمثیل الحتویین الكوني والاعتادي. 

o‏ للحصول على سیات Features‏ تركيبية مزوجة من الكونية والاعت‌ادية؛ وذلك 
للافادة منها في تدریب آسالیب الذکاء الااصطناعی الختلفة. 

ولا كان ادف النشود من البناء یتطلب dy‏ معلومات نحوية حول آجزاء 
الترکیب الجملي في الدونة اللغويق فقد اعتمدت الدراسة على النظرية الوصفية في تمثيل 


۰۷۳ ص‎ ee YA AY » البهنساوي (حسام): القواعد التحويلية في دیوان حاتم الطائي مكتبة الثقافة الدينيق القاهرة‎ CY) 
بجامعة میشیغان‎ Computational Neurolinguistics Lab قد استخدم ختبر اللسانیات العصبية الحاسوبية‎ (Y) 
هذا التمثيل المكوني باعتباره بدیلا عن النموذج النحوي الذهني وذلك‎ University of Michigan الأمريكية‎ 
لحساب عدد العْقد في الترکیب الجملي مقارنة بعدد الشتبکات العصبية التي تتشکل داخل الذهن البشري آثناء نطق هذا‎ 
i ۱ التركيب الحمل . ينظر:‎ 

.Hale, ل‎ & Callaway, ۲ & Feldman, E. et al., (2014). Ibid 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


العلاقات التركيبية باعتبارها ملاذًا لتوفير المعطيات اللغوية التى تمثل خخصائص خاصة 
للغة المعينة؛ إذ يتنوع التوصيف eon‏ يتنوع النظم التركيبي للجملة» بعكس ما تتيحه 
النظرية التفسيرية التي تعتمد على قوانين محددة» ومن ثم معلومات محددة عن الأجزاء 
التركيبية مقارنة بالنظرية الوصفية. 

وإن هذا الوصف يقتضي تحديد مجموعة من السمات التعريفية لأنواع الجمل 
وأجزائها التركيبية» وكذلك السمات النحوية الوظيفية لوحدات جل المدونة اللغوية 
عينة الدراسة في ضوء الغرض البحثی. 

ينبغى أن نقف على المعلومات الأساسية التى سيقدمها التطبيق المنشود؛ للوقوف 
عل اللات اللغوية الناسبة لنهج البحث» ER‏ الأدوات التي تحقق الغاية منها. 
وقد شرع البحث في الفصل السابق في تعيين الاقسام الكلامية في ضوء التوصيف 
التركيبي الذي يستهدف التحليل النحوي الوظيفي. 

ویتحدّد هنا فئة العناصر الأساسية للتحليل الترکیبی - التي ينتهجها البحث في 
عنونة العلاقات التركيبية - التضمنة آنواع احمل Phrases DOT Clauses‏ وهي 
العلامات الاکثر شهرة أو استقرارًا في التحلیل التركيبي(المكوني)» وقد استخدمها بنك 
بنسلفانيا وبنك اللغة الصينية» وغيرهم مع مراعاة خصيصة كل لغة على حدة. يعرضها 


احدول ر DUM e‏ 
العناصر الأساسية 
للتحلیل التركيبي 
الحملة Sentence‏ 5 
الجملة شرطة SBAR Sentence Bar‏ 
آنواع الجما 
AU t ET‏ الاستفهامية Sentence Question‏ 50 
الصغری 
الحملة الاستفهامية 
1 0 مية SBARQ Sentence Question Bar‏ 
شرطة 
الحملة الناقصة FRAG Fragment‏ 


ةا 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


NP Noun Phrase المركب الاسمی‎ 
VP Verb Phrase الرکب الفعلى‎ 
PP Preposition Phrase dd الرکب‎ 
ADVP Adverb Phrase المركب الظرق‎ 
ADJP Adjective Phrase الرکب الوصفی‎ 
| کت‎ JA e 
WHNP Wh-Noun Phrase ad آنواع الرکبات ارك‎ 
الاسمى‎ 
د‎ Al | 
WHADV Wh Adverb Phrase - de لو‎ "is 
E 
المركت المو‎ 
WHPP Wh- Preposition Phrase doo MC + 
dAl 
CONJP Conj Phrase مركب العطف‎ 
PRN Parenthetical Phrase الترکیب الاعتراضی‎ 
PRT Particle Phrase مركب الأداة‎ 


احدول:۳۳ فئة السمات الت ركيبية 
وقد استعانت الدراسة بآلية ستانفورد"" للتحليل التركيبي -Stanford Parser‏ 
كأداة مساعدة في عنونة نصوص المدونة اللغوية بالعلاقات التركيبية - التي تم تطويرها 
من قبل فريق معاة اللغات الطبيعية بجامعة ستانفورد Stanford‏ والتي تتبع النهج 
الإحصائي في تحليل المدخلات» وقد حررت هذه الأداة بلغة الجافا البرمجية» مدعمة 
العدید من بیئات التشغیل التعددة. 


(۱) هناك محللان ترکیبان آخران» محلل بایکل Bikel‏ التركيبي الذي استعملته موسسة شبكة البیانات اللغوية LDC‏ 
في بناء مواردها النحوية ذي التمثیل المكوني» ومحلل بركلي Berkeley‏ التابع لفریق معالجة اللغات الطبيعيية بجامعة 
کالیفورنیا- بركلي» الا Kel‏ يحتويان على الناذج النحوية للغة الانجليزية Models of English syntax‏ فحسب. 
ومن ثم يحتاجان إلى مدونة للتدریب Training Corpus‏ حالة بناء نموذج نحوي للغة آخری. 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 
ویعرض الشكل رقم EY‏ نموذجًا من تحليل آلية ستانفورد لجملة من نصوص 
المدونة اللغوية» وهی ” و في آکتوبر عام pats‏ الاختيار على عهدية أحمد ك 
متحدثة رسمية عن الانتخابات والبلدية البحرينية“. إسلام آون لاين YA‏ 


D 0 "T مه هو ۳ سر و‎ sane 
O AD سمخ عن الايكبات و‎ disc 3 uas غلى هري‎ JY وهی 2006580 وفع‎ 


| 


Parser: edu'stanfordnipmodels/exparser/ar abicf atored.ser.gz 


ROOT 
5 
س ن‎ n ttm 
C P vP PUNC 
۱ cc NOR 
و‎ ۷ ۷ ۷0۵ ۷ P Pe P 
72 / ۷ 5 د‎ E 
في‎ NP NP وف‎ DINN IN NP ۱۷ ۷۳ IN m 


NN CD — Je على‎ NN NP ك‎ MN عن إل‎ NP CC NP 
عهدبة 6 انور‎ NNP Gaia رسمية‎ — DINNS و‎ DINN DT) 


ليحريتية alll‏ الانتحایات احمد 


شکل:۱؛ آلية ستانفورد للتحلیل (es A‏ 
وقد استعانت الدراسة بأداة تحرير الدونات اللغوية الموصفة ذات الصيغة التقويسية 
۵ التي تم تطویرها في الأصل من قبل اللغوي الأمريكي آنطون انجسون 
Anton Ingason‏ أثناء العمل على مشروع الدونة التاريخية الوصفة للغة الايسلندية 
c Icelandic Parsed Historical Corpus (IcePaHC)‏ ثم تطورت لاحقا إلى ما 
صارت عليه الآن على يد اللغوية الأمريكية جانة بك Jana Beck‏ وقد خضعت هذه 


)١(‏ يمكن الاطلاع على آلية ستانفورد للتحليل التركيبي من خلال هذا الرابط: 
Stanford-parser . (2014). http://nlp.stanford.edu/software/lex-parser.shtml‏ 
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هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقياً 
أو تداولها تجاریا 


الاداة لرخصة جنو العامة GNU General Public License (GPL)‏ التي پسمح 
بمقتضاها نسخ أو استخدام الأداوات باعتبارها ملكية عامة. © 

وتم تحرير هذه الأداة ک واجهة استخدام رسومية GUI‏ باستخدام لغة الجافا 
سکریبت davascript‏ بحیث عکن الستخدم من تحرير المدونة من خلال رؤية 
التحلیلات نفسهاء آما نواة النظام فقد حررت بلغة البایشون البرمجية. 

ویعرض الشکل رقم EY‏ صورة للأداة أثناء تحریر رجات محلل ستانفورد التركيبي 
للمدونة اللغوية وفق العایر الحددة. 


Annotald‏ او 
|D 127.0.0.1:8080/ahmed‏ © < 


NP 
[orwws 


cc 
71 


DTNN 
DT) [asea] 


الشكل £Y:‏ آداة Annotald‏ لتحریر الدونات الموصفة تر كيبا 
بعد إجراء عملية التحریر على التقویس الشجري» یمکننا أن نختبر دقة الآلية من 
لمواضع الا ختلاف بين التحلیلین. 


CO‏ للاطلاع على الأداة» وتحميلهاء من خلال هذا الرابط: 
/Annotald Program. (2015). https://annotald.github.io‏ 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
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ROOT 


| 

N N ¥ N NP‏ ا 0 N Ng;‏ في 

"| | | DOM LAN ] ge يد‎ 
NO ۰ الاختیار‎ p NN ك‎ N ا عن لل‎ 0 ۰ ۴ 
[E s | | | L D FS 


J - 9‏ - رسمية iw pe Bs‏ 6 اکتویر 


البحرينية البلدية الانتخابات aal‏ 


CC PP VP PUNC 


| .07 | 
N NP VBD NP P PP. l‏ 3 
LAN T | yN‏ 
ü NP NP dà DTNN IN NP IN NP PP‏ 
WT n‏ ( ۱ | | * 
NN NNP J NN J IN NP‏ على NN CD Layi‏ 
S LT ue‏ 1 ۱ 
v NP‏ ۳ عن رسمية متحدثة M‏ عهدية 6 اكتوبر 
um T‏ ر 5 
البحرينية البلدية الانتخابات 
الشکل: 4-۳ ما قبل التحریر وما بعد التحریر التركيبى 
وبملاحظة التحلیلین للجملة» نجد اختلافا واضحًا بين التحلیل الآلي والتحلیل 
الذي آجری عليه التعدیلات. والتی تمثلت في توازي بنية المركب الاسمی NP‏ " عهدية 
أحمد“ على اعتبار eel‏ يشتركان في الوظيفة النحوية الدلالية» وانتقال المركب الحرفي PP‏ 
من سيطرة الرکب الفعلى مباشرة إلى سيطرة الرکب الحرفي ”ك متحدثة رسمية“؛ لاه 
ليس و سيط Argument‏ للفعل. 
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هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


ویمکن حساب دقة نتائج الالية (التقویس) في الثال السابق مقارنة بالتعدیلات 
التی أجريت عليه من خلال معادلتی الدقة والراجعة: 

الدقة ‘Precision‏ هي حساب عدد الوحدات الصحيحة على قيمة عدد النتائج 
السترجعة أي التي أخرجتها الآلية» وذلك باستخدام هذه العادلة: 


D. t 
Precision — p 
tp + fp 


حيث TP‏ تعني True Positive‏ القیم الامجابية الصحيحة (عدد الأقواس 
الصحيحة)» و۴۴ القیم الإيجابية الخاطئة (عدد الأقواس الخاطئة المثبتة في الخزج) . 
وبتطبیق العادلة : 
15 


93.75 — 71541 = 


الراجعة ‘Recall‏ هي حساب عدد الوحدات الصحيحة على قيمة عدد النتائج 
الكلية» باستخدام هذه العادلة: 


Recall = — الل‎ 
tp + fn 


حيث FN‏ تعني False Negative‏ القیم السلبية الخاطئة (عدد الاقواس الخاطئة 


. الگبتة)‎ P 
: وبتطبیق العادلة‎ 
88.24 — - m 
"t 1154+42 


س وات 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


وباحاد ceu‏ الدقة والراجعة» نحصل على مقياس متو سط الحساب للنتائج من 
خلال معادلة الوسط التوافقی: 


59 1 _ (B?+1)PR 


1 1 — 8?P«R 
— + )1 = 
0 ( 00 


F=? precision - recall 
— " precision + recall 
وبتطبیق العادلة:‎ 


93.75*88.24 2 
93.75-- 88.24 


90.91 = 2 * 93.75 + 88.24/(93.75 + 88.24) = 


هذا بالنسبة لاختبار الالية على مستوی الجملة الواحدة» آما اختبار الالية الذي 
آجري على ۰ من حجم بنك بنسلفانیا العربي» فیعرضها الجدول رقم ۳: 


المتوسط 
النموذج التركيبى طول الحملة الدقة الراجعة ۳ 
i Recall Precision Length Syntax Model‏ 
F-measure‏ 
0 كلمة 80.37 79.36 79.86 
ستانفورد 
عام 78.92 11.12 78.32 


Y £:0 9321‏ قياس آداة محلل ستانفورد es A‏ 


(1) Green, S & D.Manning, C. (2010). Better Arabic Parsing: Baselines, Evaluations, and 
Analysis. In Proceedings of the 23rd International Conference on Computational Linguistics 
(Coling). Beijing. 
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هذه الطبعة 
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ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


ثم كانت الخطوة التالية باستخدام آداة التوازي Mapping‏ بين الاقسام الكلامية 
التي ينتهجها البحث (فئة آر دي آي الکلامية)؛ والأقسام الكلامية التي تنتهجها آلية 
ستانفورد" اللتحلیل التركيبي؛ ليظهر المثال السابق كالآتي: 

”وف آکتوبر ۰۰ Y‏ وقع الاختیار عل عهدية اجد کمتحدثة رسمية عن الانتخابات 
والبلدية البحرينية“. اسلام آون لاين Y‏ 


(ROOT 
(S (NullPrefix*Conj-*NullSuffix 3) 
(PP (NullPrefixtPrepos-*NullSuffix (في‎ 
(NP 
(NP (NullPrefixtNoun*NoSARF-4*Masc-tSingle-cNullSuffix gus ep) 
(NP (CD 2006)))) 
(VP (NullPrefixtActivetVerbt*PasttNullSuffix &33) 
(NP (Definit-*NountNounInfinit*NullSuffix 5Ul335N1)) 
(PP (NullPrefixtPrepos*NullSuffix (علی‎ 
(NP (NullPrefix*tNoun-c*RelAdj-*Femin*Single i543) 
(NP (NullPrefixtNoun-*NoSARF-4NullSuffix ds e gi 
(PP (NullPrefixtPrepos-*NullSuffix 43) 
(NP (NullPrefixtNoun*SubjNouncFemin*Single (مُتَحَدَّثَةَ‎ (NullPrefix-N 
oun+RelAdj+Femin+Single ài$a455))) 
(PP (NullPrefixtPrepos-*NullSuffix jj) 
(NP 
(NP (Definit-NountNounInfinittPlural*Femin SU50&3 Y1)) 
(NullPrefixt*Conj-*NullSuffix 3) 
(NP (Definit+Noun+RelAdj+Femin+Single iĝa ji) (Definit+Noun+R 
elAdj+Femin+Single (((((الْبَحْرَيْنِيّة‎ 
(PUNG. 7)) 


(۱) انظر للشکل رقم 48-1۳ للتعرف على الا قسام الكلامية التي تنتهجها آلية ستانفورد. 


-MA- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


٠-٤‏ فئة العناصر الأساسية للتحليل التركيبى 


4 -۱-۱عل مستوى التركيب الجمل 


تعددت تصانيف آنواع الجمل لدى علماء النحو العربي القدامى والمعاصرين» إذ نجد 
ابن هشام يقسمها إلى ثلاثة أنواع» فيقول: «انقسام الجملة إلى اسمية وفعلية وظرفية» 
فالاسمية: هي التي صدرها اسم كزيد قائم وهيهات العقيق» وقائم الزيدان عند من 
جوزه وهو الأخفش والکوفیون والفعلية: هي التي صدرها فعل ك «قام زيد» وضرب 
اللص» وكان زيد d‏ ويقول زید 35 والظرفية المصدرة بظرف أو مجرور نحو: 
أعندك زيد؟ أو: أفي الدار زيد؟ إذا قدرت زيدًا فاعلا بالظرف والجار والمجرور.() 

cde "TUI‏ الفارسي» وال زخشري وعبد القاهر الجرجاني فیصنفوها إلى أربعة آنواع» 
إذ يقول عبد القاهر:«فقد حصل لك أربعة أضرب من الجمل» وهي في الأصل اثنتان: 
امحملة من الفعل والفاعل» والجملة من المبتدأ GL‏ بينم الشائع عند النحويين أن 
الجملة نوعان: اسمية متمثلة في عنصري الاسناد البتداً والخبر» وحملة فعلية متمثلة في 
عنصري الإسناد الفعل والفاعل. 

وتوسع بعض النحويين في تصنيف ذلك التقسيم بجعله في إطار أكثر شمولية» 
حيث قسموا الجملة إلى جملة كبرى وصغرىء وقال:«الکبری: هي الاسمية التي خبرها 
Deje‏ «زيد قائم cto ul‏ وازيد أبوه قائم»» والصغرى: هي البنية على المبتدأ كالجملة 
الخبر بها في المثالين»”". وهو ما یتوافق مع تصنیف الدراسات اللغوية العاصرة مع 
احتلاف التقسیات الداخلية D‏ 

والواقع أن توخي أيّا من هذه التصنیفات مشروط بمنهجية حددة فلیست کل هذه 
التصنیفات ملاتمة لكل اللغات. إذ لكل لغة خصاتصها التركيبية التي تمتاز بها عن 
غيرهاء فخواص لغة الأدب التركيبية تختلف عن خواص لغة الصحافة التى اكتسبتها 
من مصادر عدة. 


بيروت» ۰۱۹۹۱ الجزء الثاني» ص ٤۳۳‏ . 

- الجرجاني (عبد القاهر): كتاب المقتصد في شرح الایضاح. تحقيق د. كاظم بحر المرجانء دار الرشيد للنشر‎ (Y) 
.۲۷۷ الجمهورية العراقية ۰۱۹۸۲ مجلد ۰۱ ص‎ 

(۳) الأنصاري (ابن هشام): السابق» ص ETV‏ 

C£)‏ للاطلاع حول بعض تصنیفات الجمل في الدراسات اللغوية المعاصرة» ینظر: البهنساوي (حسام): القواعد التحويلية 
في ديوان حاتم الطائي» ص ۰۸۸-۸۷ 


-199- 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


ولا كانت الدراسة قد اتخذت الاسناد والترکیب التام الفید وسيلة لتحدید آبعاد 
الجملة في تجزئتها لنصوص المدونة» فقد انحصرت آنواع الجملة في أربعة آنواع: 

© الجملة البسیطة: هي الجملة المكونة من عملية إسنادية مستغنية بنفسها عن غيرها 
شکلا ودلالة» وهي اسمية DR y‏ 

« الجملة المركبة: هي الجملة المكونة من مركبين أحدهما مرتبط بالآخر» ومتوقف 
cade‏ يتم به الكلام. 

«الجملة الناقصة: هي الجملة التي تفقد أحد أركانها الإسنادية» وتتمثل في عناوين 
الصحف والقصص..... 

«الجملة التكميلية: هی الحملة الكونة من عناصر داخلة أو ملازمة لعناصر الاسناد 
SEPT‏ وتتصدر بمکمل complementizer‏ مثل ضائر الوصل O,‏ 

وتتضح هذه الأنواع في ضوء تمثيلها في تلك العلامات: 

"S" الحملة‎ o 

تستخدم هذه العلامة لنمطي الجملة البسيطة والمركبة بنوعیهما الاسمي والفعلي» 
مثلة لرأس الحملة. 

”ل يسقط السادات هذه M‏ في فخ النمط.“ 


(ROOT 


PresenttActive-4Verb4tNullSuffix biws) 


B 
(PRT (NullPrefix*JAAZIMA-*NullSuffix gJ)) 
( 
(NP (Definit-*Noun-*Femin-*Plural (السادات‎ 
( 


(NP (NullPrefixtNoun-*DemoPro-*FemincSingle (هذه‎ ( 
(NP (Definit+Noun+tFemin+Single (((المرة‎ 
(PP (NullPrefixtPrepos-*NullSuffix (في‎ 
(NP (NullPrefixtNountNullSuffix )فخ‎ 
(NP (Definit*Noun-*NullSuffix نمط‎ 1!))))) 


(PUNC .))) 


.۵۳ عاشور (النصف): بنية الجملة العربية بين التحلیل والنظریة» ص‎ )۱( 
(2) Radford, A. (2009). An Introduction to English Sentence Structure. Cambridge University 
Press. P.49. 


=f هه‎ 


هذه الطبعة 

إهداء من المركز 

ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


«معروضات المتحف توحي بأن الإنسان عاش في زمن الدیناصورات.» 


(NP (NullPrefix*Noun*ObjNoun*FemintPlural (معروضات‎ 
(NP (Definit*Noun-*NullSuffix (((المتحف‎ 
(VP (Present*ActivetVerb-*NullSuffix >>) 
(PP (NullPrefix*Prepos*tNullSuffix (ب‎ 
(SBAR (NullPrefixParticleNAASIKH-4NullSuffix gÍ) 
(S 
(NP (Definitt*NountNullSuffix ((الانسان‎ 
(VP (NullPrefixtActive*tVerb-*Past-*NullSuffix (عاش‎ 
(PP (NullPrefixtPrepos-*NullSuffix )في‎ 
(NP (NullPrefixtNoun-*NullSuffix jaj) 
(NP (Translit (((((((((الديناصورات‎ 


(PUNC .))) 


”نحن لدینا کل الثقة بأنفستا * 


(NP (NullPrefixtNoun*SubjPro*NullSuffix ((نحن‎ 
(NP (NullPrefixtDZARF-*Adjunct-4NullSuffix (لدي‎ 
(NP (NullPrefixtNoun-*Pronoun-cNullSuffix Li) ) 
(NP 
(NP (NullPrefixtNoun*NullSuffix Js) 
(NP (Definit*Noun-cNounInfinit*Feminc*Single (((الثقة‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON o) 
(NP (NullPrefix*Noun-Plural-NullSuffix gil) 
(NP (NullPrefixtNoun*Pronoun-tNullSuffix ((((نا‎ 


(PUNC |..))) 


”وقد آکدت اهیئات النظمة للمؤقر على استمرار دعمها للکیانات الجديدة الناشتة؛ 
حيث ستقوم بتوفیر ما ستحتاجه تلك الکیانات من تدریب لاعضائها» وعقد فاعلیات 
تساعد على تناقل الخبرات بين آعضانها.* 


(ROOT 
(S 
(S (NullPrefixtConj-*NullSuffix )۾‎ 
(VP 
(PRT (NullPrefix*NoSyntaEffecterNullSuffix )قد‎ 
(NullPrefix+Verb+Past+Femin+Single (أكدت‎ 
(NP 
(NP (DefinittNoun*Femin*Plural (الهيئات‎ (DefinitrNoun*tSubjNoun 
*Feminc*Single (المنظمة‎ 
(PP (NullPrefixtPrepos-*NullSuffix J) 
(NP (DefinitctNoun*ObjNoun4NullSuffix ((((الموتمر‎ 
(PP (NullPrefixtPrepos-*NullSuffix (علی‎ 
(NP (NullPrefix*Noun-*NounInfinit*NullSuffix (استمرار‎ 
(NP 


EIL 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


(NP (NullPrefixtNountNullSuffix ge») 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix (((ها‎ 
(PP (NullPrefixtPrepos-*NullSuffix J) 
(NP 
(NP (DefinitctNoun*Femin*Plural (الکیانات‎ (Definit*No 
uncExaggAdj-*FemintSingle (الجديدة‎ (Definitt*NountSubjNount*FemintSingle 
(((((((((الناشئة‎ 
(PUNC  ;) 
(SBAR 
(WHADVP (NullPrefixtCondJAAZIMA*DZARF4*NullSuffix (حیث‎ ( 
(S 
(VP (Futurec*Present*Active*Verbt*NullSuffix (ستقوم‎ 
(PP (NullPrefix*Prepos*tNullSuffix )ې‎ 
(NP (NullPrefix*Noun-*NounInfinittNullSuffix (توفیر‎ 
(SBAR (NullPrefixtNounctRelPro-*NullSuffix Ln) 
(S 


(VP (Futurec*PresenttActive-*Verbt*NullSuffix (ستحتاج‎ 

(NP (NullPrefixtNoun-*Pronoun-tNullSuffix »)) 
(NP 
(NP (NullPrefixtNoun-*DemoPro-*FemincSingle (تلك‎ ( 

(NP (DefinitctNoun*Femin*Plural (((الکیانات‎ 

(PP (NullPrefix*Prepos-*tNullSuffix jn) 

(NP 
(NP (NullPrefixtNoun-*NounInfinit*NullSuffix 


( (تد ریب 
(PP (NullPrefixtPrepos-*NullSuffix J)‏ 
(أعضاء (NP (NullPrefixtNountPlural-*NullSuffix‏ 
(NP (NullPrefixtNoun-*Pronoun-tNullSuffix‏ 


(PUNC ,) (NullPrefix*Conj-*NullSuffix )۾‎ 
(S 
(NP (NullPrefixtNoun*NullSuffix siec) 

(NP (NullPrefixtNoun-*SubjNoun*tPluraltRelAdj-*Fem 
in (((فاعلیات‎ 
(VP (Present-*Active-*Verb-*NullSuffix (تساعد‎ 
(PP (NullPrefixtPrepos-*NullSuffix (علی‎ 
(NP (NullPrefixtNoun-*NounInfinit*NullSuffix 
(تناقل‎ 
(NP (Definit*Noun-*Femin-*Plural (((الخبرات‎ 
(NP (NullPrefixtNoun-*NullSuffix (بین‎ 
(NP (NullPrefixtNountPlural4NullSuffix (أعضاء‎ 

(NP (NullPrefix*Noun-*Pronoun-tNullSuffix 


((((((((((((((ها 
(PUNC_ .(((‏ 


"الاسلامیون یتراجعون بعد تشقق حركة الاصلاح قبل أن تعلن وزارة الداخلية 
ا لجزائرية عن القوائم الانتخابية القبولة وفق قانون الانتخابات.* 


(NP (Definit+Noun+NounInfinit+Plural+MARF+RelAdj+Masc+NonAdjunct 
(#۱سلامیون‎ ( 

(VP (Present+Active+Verb+MARF+SubjPro (یتر اجعون‎ 

(NP (NullPrefixtNoun-*NullSuffix (بعد‎ 

(NP (NullPrefixtNoun-*NounInfinit*NullSuffix (تشقق‎ 
(NP (NullPrefixtNoun*Femin*Single (حركة‎ 
(NP (Definit-*NountNounInfinit*NullSuffix لاصلاح‎ ۱ ((((( 
(NP (NullPrefix+Noun+NullSuffix (قبل‎ 


Lic‏ ات 


هذه الطبعة 

إهداء من المركز 

ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


(SBAR (NullPrefix4ParticleNAASSIB-4NullSuffix (أن‎ 
(S 
(VP (PresenttActive-*Verb*tNullSuffix (تعلن‎ 
(NP (NullPrefix*Noun*Femin-*Single (وزارة‎ 
(NP (Definit*Noun-*SubjNoun-*RelAdj-*Femin-*Single 


(((الجزائرية (Definit*Noun*tNoSARF*PluralckRelAdj4FemintSingle‏ (الداخلية 
(PP (NullPrefix-*Prepos-tNullSuffix ġe)‏ 
(Defi‏ (القو انم (NP (Definit-NountNoSARF-«*Plural*NullSuffix‏ 
(DefinittNoun*ObjNou‏ (الانتخابية nit+Noun+NounInfinit+RelAdj+Femin+Single‏ 


n+Femin+Single ((المقبولة‎ 
(NP (NullPrefixtNoun-*NullSuffix (وفق‎ 
(NP (NullPrefixtNoun-*NullSuffix (قانون‎ 
(NP (Definit*Noun-*NounInfinit*Femin-tPlural 
((((((((۲لانتخابات‎ 


(PUNC .))) 


« الجملة ”شرطة“ "SBAR"‏ 

تستخدم هذه العلامة للجملة التكميلية المتمثلة في جملة الصلة التي تتصدرها اسم 
موصول ( الرأس) سواء أكان خاصًا أو مشتركاء والجملة الثانوية مثل جملة مقول القول.“ 

”فهي الغامضة. التي لا تريد استعراض قلبها وبضاعتها النفسية» من أول حظة.* 


(ROOT 
(S 
(PRT (NullPrefix*Conj-*NullSuffix .3)) 
(NP 
(NP 
(NP (NullPrefixtNoun*SubjPro-*NullSuffix (هي‎ ( 
(ADJP (Definit+Noun+SubjNoun+Femin+Single (((الغامضة‎ 
(PUNC ,) 
(SBAR 
(WHNP (DefinittNoun*RelPro*FemintSingle (التي‎ 
(S 
(VP 
(PRT (NullPrefix*LAA-*NullSuffix Y)) 
(Presentc*ActivetVerb-4NullSuffix (ترید‎ 
(NP 
(NP (NullPrefix*Noun-*NounInfinit*NullSuffix (استعر اض‎ 
(NP (NullPrefixtNoun-*NullSuffix (قلب‎ 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix (((ها‎ 
(NullPrefix*Conj-4*NullSuffix (و‎ 
(NP 
(NP 
(NP (NullPrefixtNoun-cFemin-*Single ieLaj)) 
(NP (NullPrefixtNoun*ProNoun-*NullSuffix (((ها‎ 
(ADJP (Definitt*Noun*tRelAdj*FeminsSingle ((((((((النفسية‎ 


(PUNC ;) 

(PP (NullPrefixt*Prepos*tNullSuffix jn) 

(NP 
(ADJP (NullPrefixtNoun4MasctNullSuffix (أول‎ 

(NP (NullPrefixtNoun-cFemin-*Single ih» J))))) 


(PUNC | .((( 


(1) Maamouri, M. et al,. (2011). Penn Treebank Guidlines. Linguistic Data Consorttium. P.21. 


e ae 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


”وقال في حواره مع إسلام آون لاین: إن السینا السعودية ما زالت ف البداية.* 


(ROOT 
(S (NullPrefix+Conj+NullSuffix (و‎ 
(VP (NullPrefix+Active+Verb+Past+NullSuffix (قال‎ 
(PP (NullPrefixtPrepos-*NullSuffix (في‎ 
(NP 

(NP (NullPrefix+Noun+NullSuffix ار‎ >) 
(NP (NullPrefix+Noun+tPronountNullSuffix (((ه‎ 

(NP (NullPrefix+DZARF+Adjunct+NullSuffix qa) 
(NP (Translit (((((إسلام-أونلاين‎ 


(PUNC :) 
(SBAR (NullPrefix+ParticleNAASIKH+NullSuffix ùj!) 
(S 
(NP (Translit (السينما‎ (Definit+Noun+tRelAdj+Femin+Single 
((السعودیة‎ 
(VP 
(PRT (NullPrefix*NoSyntaEffectt*NullSuffix (ما‎ ( 
(NullPrefixtActive-*Verbt*PasttFemintSingle الت‎ j) 
(PP (NullPrefixtPrepos-*NullSuffix (في‎ 
(NP (DefinitctNoun*Femin*Single (((((((البداية‎ 
(PUNC  .))) 


© الجحملة الاستفهامة "SQ"‏ 
تستخدم هذه العلامة للجملة الاستفهامية التي تشتمل على حرف استفهام (همزة - 
هل)» والتي يتوقع منها الاجابة المباشرة بلا أو نعم أو بلى.“ 


”هل تتخوفون من وقوع حرب أهلية؟“ 


(ROOT 
(SQ 
(PRT (NullPrefix*InterrogArticle-cNullSuffix ((هل‎ 
(VP (Present+Active+Verb+MARF+SubjPro (تتخوفون‎ 
(PP (NullPrefixtPrepos-*tNullSuffix jn) 
(NP (NullPrefixtNountNullSuffix (وقوع‎ 
(NP (NullPrefixtNoun-*NullSuffix (حرب‎ 
(NullPrefixtNoun*RelAdj4*FemintSingle (((((أهلية‎ 
(PUNC ?))) 


(1) Maamouri, M. et al,. (2011). Ibid. P.23. 


ع ۲۰ - 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


*SQBAR" TF لة الا‎ 1 T 
تستخدم هذه العلامة للجملة الاستفهامية التي تشتمل على اسم استفهام» وغالبا ما‎ 
O يتوقع منها إجابة ضمنية.‎ 
TED افضة‎ JI سسة الدينية‎ I “كيف تنظر إلى‎ 
BRAND 


(WHADVP (NullPrefixtNoun-cNullSuffix (كيف‎ ( 
(S 
(VP (Present+Active+Verb+NullSuffix (تنظر‎ 
(PP (NullPrefixtPrepos-*NullSuffix yJ!) 


(NP 
(NP (Definitt*Noun*ObjNoun4*FemintSingle ال موسسة‎ ( (Definit*N 
ountRelAdj4FemintSingle (الدينية‎ (DefinittNoun*SubjNouncFemincSingle 
((الر افضة‎ 
(PP (NullPrefixtPrepos-*NullSuffix J) 
(NP (Translit السيتمًا‎ 0 
(PUNC ?))) 


«الجملة الناقصة “FRAG”‏ 
تستخدم هذه العلامة للجملة التی تفقد آحد آرکانها الإسنادية» وغالبا ما تتمثل في 


عناوین الصحف. والقتصص. والقوائم. i‏ 
مغازلة انتخايية.** 


(ROOT 
(FRAG 
(NP (NullPrefixtNouncFemin-cSingle (مغازلة‎ 
(NP (NullPrefix*Noun-*NounInfinittRelAdj*FemintsSingle (((انتخابية‎ 


(PUNC | .))) 


46 ۰ وو‎ 
دارون.‎ e اصطدام‎ 
(ROOT 
(FRAG 
(NP (NullPrefix*NountNounInfinit*NullSuffix (اصطد ام‎ 
(NP (NullPrefixtDZARF-*Adjunct-*NullSuffix qa) 
(NP (Translit (((دارون‎ 


(PUNC .)))‏ 
"خحامسا: ظاهرة الشر کات العائلية.* 
(ROOT‏ 
(FRAG‏ 

(NP (NullPrefixtNoun-*SubjNoun*NullSuffix (خامسا‎ ( 

(PUNC  :) 

(NP (NullPrefix*Noun*SubjNoun-*Femin-*Single ôa Lb) 

(NP (DefinittNoun*Femin*Plural (الشرکات‎ (Definitt*NountSubjNoun*Rel 

Adj+Femin+Single (((العائلية‎ 

(PUNC .((( 


(1) Maamouri, M. et al,. (2011). Ibid. P.25. 
(2) Maamouri, M. et .یله‎ (2011). Ibid. P.27. 


-۲ ۰ ۵- 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


DLS M على مستوی‎ ۲-۱-۶ 

© الرکب الاسمی "NP"‏ 

(aga هبو لین‎ jue Slo لس قفا‎ col se له ال ك‎ uas 
عاملا عمل فعله» ویمثل رأس الرکب في التركيب الشجري.‎ 

"ونحن الآن لا نتوفر على إحصائيات دقيقة.“ 


(ROOT 


(S (NullPrefixtConj-*NullSuffix (و‎ 

(NP (NullPrefix*Noun*tSubjPro-*NullSuffix (نحن‎ ( 

(NP (Definit*Noun*tNullSuffix ((الآن‎ 

(VP 
(PRT (NullPrefix-*LAA-*NullSuffix Y)) 
(Present+Active+Verb+NullSuffix (نتوفر‎ 

(PP (NullPrefixtPrepos-*NullSuffix =) 
(NP (NullPrefixtNoun-*NounInfinittPluralc*RelAdj-*Femin (إحصائيات‎ 


(NullPrefix*Nount*ExaggAdj-*FemintSingle ((((دقيقة‎ 


(PUNC. .)))‏ 
Ale‏ رکب الفعل *VP"‏ 
يقصد به الميئة التركيبية البدوءة بفعل أو مصدر عامل عمل فعله ویمثل رس 
المركب في التركيب الشجري.۲" 
رسع E UN‏ رمو 


(ROOT 


(S (NullPrefixtConj-*NullSuffix (و‎ 
(VP (Present*ActivetVerb-4NullSuffix (تنستمر‎ 
(PP (NullPrefixtPrepos*ParticleNAASSIB-*NullSuffix (حتی‎ 
(NP (CD 24-2-2008)))) 


(PUNC .(((‏ 
© الرکب الحرفي "PP"‏ 
يقصد به الهيئة التركيبية البدوءة بحرف من حروف الجر سواء آکان GLA‏ أو «Kal;‏ 
ویمثل واس الركت ف EUM‏ الج 
”عجزواعن صنع جيل من الرائدات النسویات.* 


(۱) ينظر: عبادة (محمد إبراهيم): الجملة العربية» مكوناتها- أنواعها- تحليلها. ص ۵۷. 
(۲) ينظر: عبادة (محمد إبراهيم): الصدر «XU‏ ص eee‏ 
(Y)‏ ينظر: عبادة (محمد إبراهيم): المصدر «XU‏ ص NYE‏ 


=Y v e 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


(ROOT 
(S 
(VP (NullPrefix-ActivetVerb-*PasttSubjPro | (عجزو‎ 
(PP (NullPrefixtPrepos-*tNullSuffix ġe) 
(NP (NullPrefix*NounNounInfinittNullSuffix (صنع‎ 
(NP 
(NP (NullPrefixtNoun-*NullSuffix (جيل‎ ( 
(PP (NullPrefixtPrepos-*NullSuffix jn) 
(NP (DefinitctNoun*SubjNoun*Femin*Plural (الرائدات‎ (Definit 
*NountPlural*RelAdj-4*Femin (((((((النسویات‎ 
(PUNC .((( 


الرکب الظرنی "ADVP"‏ 
یقصد به anal‏ التركيبية البدوءة بالظرف الدال على زمان ومکان انجاز احدث. 
والتضمن معنی d"‏ والذی پمثل رأس ال رکب ف الترکیب الشجری.() 


"فهناك ۸۲۰ من آفراد العينة حاصلون على شهادة جامعية.* 


(ROOT 
(S (NullPrefix*Conj-*NullSuffix .3) 
(ADVP (NullPrefix-DZARF-4*NullSuffix (هناك‎ ( 
(NP 
(NP (CD 60%)) 
(PP (NullPrefixt*Prepos-*tNullSuffix jn) 
(NP (NullPrefixtNountPlural4NullSuffix (أفراد‎ 
(NP (Definit-NouncFeminctSingle (((((العينة‎ 
(NP (NullPrefixtNoun*SubjNoun*Plural4*MARF4MasctNonAdjunct (حاصلون‎ 
(PP (NullPrefixtPrepos-*NullSuffix =) 
(NP (NullPrefix*Noun-*NounInfinitt*FemintSingle (شهادة‎ (NullPrefix* 
Noun+SubjNoun+RelAdj+Femin+Single ((((جامعية‎ 
(PUNC .))) 


9 الرکب الوصفی "ADJP"‏ 
يقصد به الهيئة التركيبية البدوءة بو صف أو مشتق محض ( اسم فاعل» اسم مفعول؛ 
صفة مشبهة» اسم تفضيل)» تمثلا رأس المركب في التركيب الشجري. O‏ 


”وبقول آخر: الدور هو حصيلة جمع الممثل بالشخصية. “ 


(۱) ينظر: عبادة (محمد إبراهيم): المصدر السابق» ص ۰۱۱۰ 
(Y)‏ ینظر: عبادة (محمد إبراهيم): المصدر السابق» ص AY‏ 


ES y- 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 

أو تداولها تجاریا 


(ROOT 
(S 
(S (NullPrefixt*Conj-*Null 
(PP (NullPrefix4 
(NP 
(NP 


LSuffix (و‎ 
FPrepos-*NullSuffix )ې‎ 


(NullPrefix*Noun*NullSuffix (قول‎ 
(ADJP (NullPrefixtNoun-*NoSARF-*NullSuffix ,31))))) 
(PUNC :) 


(S 

(N 
(N 
(N 


P (Definit+Noun+Null 


( 
P (NullPrefix+Noun+SubjPro+NullSuffix (هو‎ ( 
P (NullPrefix+Noun+tExaggAdj+Femin+Single (حصيلة‎ 
(NP (NullPrefix+Noun+NullSuffix (جمع‎ 


(NP (Definit+Noun+SubjNoun+NullSuffix ((((الممثل‎ 
(PP (NullPrefix+Prepos+NullSuffix (ب‎ 


(NP (Definit+Noun+RelAdj+Femin+Single ((((الشخصية‎ 
(PUNC_ .((( 


LSuffix (الدور‎ ( 


* ال رکب الوصول الاسمی *WHNP"‏ 

كيدي اه از کی دوز باسم موصول والاسم الوصول هو ما لایصیر 
جزءا من جملة إلا بصلة وعائد. ویمثل رأس الرکب في الترکیب الشجري" 

”وهو ما يجعل طبيعة الاستثار آقرب إلى المقامرة.“ 


(ROOT 
(S (NullPrefixtConj-*NullSuffix (و‎ 


(NP (NullPrefixtNoun*SubjPro*tNullSuffix (هو‎ ( 
(SBAR 


(WHNP 


(NullPrefix*NounctRelPro-*NullSuffix Ln) ( 
(S 


(VP (Present+Active+Verb+NullSuffix (یجعل‎ 
(NP (NullPrefix*Nounc*ExaggAdj-*FemintsSingle (طبيعة‎ 
(NP (Definit*Noun-*NounInfinittNullSuffix (((الاستثمار‎ 
(ADJP (NullPrefixtNoun-*NoSARF4NullSuffix آقرب‎ ( 
(PP (NullPrefixtPrepos-*NullSuffix yJ!) 


(NP (Definitc*NouncFemin*Single (((((((المقامرة‎ 
(PUNC .((( 


« ال رکب الوصول الظرفي ^WHADV"‏ 
یقصد به الهيئة التركيبية البدوءة بمصدرية ظرفية (کلیا» بینما» حين|»...) » تمثل رس 


المركب في التركيب الشجري. 
"تعلم أنه Us‏ ارتفعت سوق المال» اقتربت لحظة الانخفاض» والعكس صحيح.“ 


(۱)ینظر: عبادة (حمد |براهیم): الصدر السابق» ص ۰۱۰۱ 


- ads 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


(VP (Present-*Imperative-Active-tVerbtNullSuffix (تعلم‎ 
(SBAR (NullPrefix-ParticleNAASIKH-4NullSuffix gf) 
(S 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix (ه‎ ( 
(SBAR 
(WHADVP (NullPrefixtCondNotJAAZIMA-*NullSuffix (کلما‎ 
(S 
(VP (NullPrefix*VerbtNullSuffix (ارتفع‎ 
(NP (NullPrefixtNoun-*NullSuffix 344) 
(NP (Definit*Noun*NullSuffix ((((((المال‎ 
(PUNC ,) 
(VP (NullPrefix*Verb*PasttFemintSingle (اقتربت‎ 
(NP (NullPrefixtNoun-*Femin-c*Single iba J) 
(NP (Definit*Noun-*NounInfinit*Intransitive4sNullSuffix 


((((((((الانخفاض 
)۾ (PUNC ,) (NullPrefix+Conj+NullSuffix‏ 
(S‏ 
(العکس (NP (Definit*Noun-*NullSuffix‏ 
( (صحيح 1111151151155+ (ADJP (NullPrefixtNountExaggAdj‏ 


(PUNC .)))‏ 
e‏ مركب عطف “CONJP”‏ 
یقصد به الکون التركيبي البدوء بحرف عطف (عادة ما یکون حرف الواو)» عطقا 
على مركب O‏ 
"ولکن هل يوجد في نطاق التعامل مع الأزمة القائمة ما يوحي بسواه؟“ 


(ROOT 
(SQ 
(CONJP (NullPrefixt*Conj*NullSuffix gy) (NullPrefixtNoSyntaEffect4NullS 
uffix (لکن‎ ( 
(PRT (NullPrefix*InterrogArticle-NullSuffix ((هل‎ 
(VP (Present*Passive4Verb-*NullSuffix (یوجد‎ 
(PP (NullPrefixtPrepos-*NullSuffix )في‎ 
(NP (NullPrefixtNoun-*NullSuffix (نطاق‎ 
(NP 
(NP (Definit*Noun-*NounInfinit4*NullSuffix (التعامل‎ 
(NP (NullPrefixtDZARF-*Adjunct-*NullSuffix qa) 


(NP (Definit-NouncFemin*Single i553!) (Definit+Noun+SubjNo 
unctFemintSingle ((((((القائمة‎ 
(SBAR 
(WHNP (NullPrefixtNounc*RelPro-*NullSuffix (ما‎ ( 
(S 


(VP (Present*ActivetVerb-*NullSuffix >) 
(PP (NullPrefix*Prepos*tNullSuffix (ب‎ 
(NP (NullPrefix*Noun-*NullSuffix (سوی‎ 
(NP (NullPrefixtNoun-*Pronount*NullSuffix ((((((((ه‎ 
(PUNC ?))) 


(1) Maamouri, M. et .یله‎ (2011). Ibid. P.59. 


ES ٠4 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


هناك علامات آخری تدخل في إطار حدید ماهية المركب: 
« التركيب الاعتراضی PRN‏ 
يراد هذه العلامة الدلالة على التركيب الاعتراضی الوصول بالاسناد والتلفظ 


فلا يحسن السکوت إلا به» ویستعمل الاعتراض للتفخيم والتأکید وتحسین الکلام 


واس اه M‏ 


”فالمسلم GH‏ (ذکرا وآنثی) هو الذي یسلم آموره إلى عبد الرمن.* 


(ROOT 
(S 
(PRT (NullPrefix*Conj-*NullSuffix .3)) 
(NP 
(NP 
(NP (Definitr*NountSubjNoun*NullSuffix (المسلم‎ 
(NP (Definit*NounNounInfinit*NullSuffix (((الحق‎ 
(PUNC -) 
(PRN 
(NP (NullPrefixtNoun-*NullSuffix ! $3) 
(NullPrefixtConj4*NullSuffix (و‎ 
(NP (NullPrefixtNoun-NullSuffix ((أنثى‎ 


(PUNC =)) 
(S 
(NP (NullPrefixtNoun*SubjPro*NullSuffix (هو‎ ( 
(SBAR 
(WHNP (DefinittNounc*RelPro*MasctSingle-*NullSuffix (الذي‎ 
(S 
(VP (Present*ActivetVerb-*NullSuffix gla) 
(NP (NullPrefixtNountNullSuffix آمور‎ ( 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix —a))) 
(PP (NullPrefixtPrepos-*NullSuffix yJ!) 
(NP (NullPrefixtNoun*NullSuffix (((((((عبد- الرحمن‎ 
(PUNC .((( 


(۱) ابن هشام (الأنصاري): السابق» ج۲ ص ۳۹۲. ینظر آیضا : عاشور (النصف): بنية الجملة العربية بين التحلیل 
والنظرية» ص ۰۲۳۱ 


ire 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


« مركب الأداة PRT‏ 
يراد هذه العلامة الدلالة على الأدوات التى تدخل على رأس المركبات ee Y‏ 
المركب deal‏ والاسمي. 


”لا يتجاوز زمنه.“ 
(ROOT‏ 
(S‏ 
(VP‏ 
(PRT (NullPrefix*LAA4*NullSuffix Y))‏ 
(یتجاوز (Present*ActivetVerb*NullSuffix‏ 
(NP (NullPrefixtNoun-*NullSuffix jaj)‏ 
(NP (NullPrefixtNoun*Pronoun-tNullSuffix —a))))‏ 
(PUNC  .)))‏ 
وه ا wa i$‏ اا اه“ 


(ROOT 
(S (NullPrefixtConj-*NullSuffix (و‎ 

(NP (NullPrefixtNoun-*DemoPro-*MasctSingle-cNullSuffix (هذ!‎ ( 
(NP 

(NP (NullPrefixtNoun-*NullSuffix 433) 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix —a))) 

(PP (NullPrefix*Prepos-*tNullSuffix )ې‎ 
(NP 
(PRT (NullPrefix-*LAA4*NullSuffix Y)) 

(NullPrefix-*Noun-*NullSuffix )شك‎ ( ( ( 


(PUNC .((( 


۲-6 فئة السمات النحوية الوظيفية 

تحاول الدراسة أن تشمل هذه الفئة جميع السیات النحوية الوظيفية التي تساعد على 
إدراك العلاقات الأساسية بين وحدات الجملة» ومن ثم فهم معناهاء وذلك باعتبارها 
الخطوة الأساسية في التحليل الدلالي» الذي يتم بموجبه الفهم الآلي للغات الطبيعية 
التمثل في عدد من التطبیقات اللغوية احاسوبية کاسترجاع المعلومات Information‏ 
Retrieval‏ و اجابة الأسئلة Question answering‏ وغيرها. 

وقد حاول الباحث أن یستخلص جميع صور العلاقات النحوية الدلالية - من 
مصادر الکتب النحوية واللغوية - في آقل عدد من الرموز» بحیث تتناسب ed‏ بعد مع 
ما تقضتبه سبل تقنیات الذكاء الاصطناعی. 

ویعرض الجدول رقم ۳۵ فئة هذه cole E‏ جملة» ثم یتبعها تفصیلا موضحًا بالامثلة 
القتبسة من الدونة اللغوية التى طبقت علیها. 


ج 


الو ظائف النحو ية 
Grammatical‏ 


functions 


الو ظائف النحو ية 
Grammatical‏ 


functions 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


-جار وجرور 
-التوکید 

-الزمان والکان 
-السببية 
-الایضاح 
-التلازم 


grege 


Subject 


Predicate 


Topic 


Object 


Verb 


Tamyiyz 


Modifier 


IDafa 


Indirect object 


emphasis 


Locative Temporal 


Purposive 


IDah 


compund 


Verb SBJ 


Conjunction 


For punc and sym 


الجدول ٠٠:‏ فئة السمات النحوية الوظيفية 


2 \ Y- 


SBJ 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقياً 
أو تداولها تجاریا 


وقد استعانت الدراسة slab‏ تحرير الدونات اللغوية الوصفة Annotald‏ في عنونة 

الدونة اللغوية بالفئات النحوية الوظيفية بعد إضافة قائمة السیات داخل نظام الآلية؛ 

حتی یمکن للمعنون اختیار السمة التي تناسب کل كلمة» كا تظهر بالشکل رقم LEO‏ 
a 5‏ 


ei Anectald 
€ ( © (1۱۵۵10۵ 


© 


۱ 


[Nure Cong AZMA +OZARF Nuutti [e] 
5 
SER 
NulPrefeParceNAASIRHeNulSufi. CON [ul] 
5 
M 
r 
[Defrit+Noun+Objoun+Femin+Plural. S8) [Zug] 


xu 


LE EUM 223 LE» 


RP 


Messages | 


Status | 


oggle ex 
E: 
PRO 
1 
08 
CON 
0F 
08 
me 
10H 
EMP 
NN 
CON 
0 
8 


* ۱۳ SS © 


: 
الشکل £o:‏ آداة Annotald‏ أثناء العنونة بالفغات النحوية الوظيفية 


se 


هذه الطبعة 

إهداء من المركز 

ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


SBJ المسند إليه‎ e 
تستخدم هذه العلامة في عدة مواضع:‎ 
فاعل/ نائب فاعل للفعل‎ o 

M adam ۰ کل جزء‎ A3 "وتصل‎ 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (Present*Active*Verb-*NullSuffix VRB (تصل‎ 
(NP (NullPrefix*tNountFeminc-Single SBJ i443) 
(NP 
(NP (NullPrefixtNountNullSuffix IDF (كل‎ 
(NP (NullPrefixtNountNullSuffix IDF (جزء‎ ( 
(NP (CD OBJ 100) 
(NP (NullPrefixtNoun*NullSuffix TMZ ((((((جنیه‎ 
(PUNC MRK .))) 


e‏ مبتدآ اسم کان» اسم إنء اسم کاد. 
"ودياسطي وبسنت لعب في منتهی الجحدية.“ 


(ROOT 
(S 

(NP (Translit SBJ (دياسطي‎ (NullPrefix*Conj-*NullSuffix CON )۾‎ 
(Translit NN (بسنت‎ ( 

(NP (NullPrefixtNountNullSuffix PRD (لعب‎ 

(PP (NullPrefixtPrepos-*NullSuffix CON (في‎ 
(NP (NullPrefix*Noun*ObjNoun-*NullSuffix IOB (منتهی‎ 
(NP (Definit-NountRelAdj-«*Femin*Single IDF (((((الجدية‎ 


(PUNC MRK .)))‏ 
* مصدر مؤول. 
”فالأخوة يجب أن تحمل مضمون التقارب.* 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON .3) 

(NP (Definit-*NountNounInfinitt*FemincSingle TPC ((الأخوة‎ 
(VP (Present*Active*Verb-*NullSuffix VRB (يجب‎ 

(SBAR (NullPrefixtParticleNAASSIBHNullSuffix SBJ jÎ) 

(S 
(VP (Present*ActivetVerb-*NullSuffix VRB (تحمل‎ 
(NP (NullPrefixtNoun*ObjNoun-*NullSuffix IOB (مضمون‎ 
(NP (Definit-*NountNounInfinit*NullSuffix IDF (((((((التقارب‎ 


(PUNC MRK .))) 


2 


هذه ا لطبعة 


اهداء من الرکز 
ولایسمح بنشرها ورقياً 
أو تداولها تجارياً 
PRD Je‏ 
تستخدم هذه العلامة à‏ عدة مواضع: 
£ 
e‏ خر P haz‏ 
ec ۰ ۰ ۰ 59‏ 
وهذا سيف دو حدين. 
(ROOT‏ 
(و (S (NullPrefixtConj-*NullSuffix CON‏ 
((هذا (NP (NullPrefixtNoun*DemoProtMasct*Single*NullSuffix SBJ‏ 
(NP‏ 


(NP (NullPrefix*NountNullSuffix PRD dsw) ( 
(NP (NullPrefix*Noun*MARF-4*MasctSingle4-Adjunct*NullSuffix MOD ,3) 


(NP (NullPrefixtNountBinary*tNonAdjunct*MANSSC*MAGR IDF ((((حدين‎ 
(PUNC MRK .))) 


© خبر إن وأخواتهاء خبر كان وأخواتها في حالة کونه اسمّ). 
”وقال: إنه آمر آن الأوان لافتتاحه.“ 


3 


(ROOT 


(S (NullPrefixtConj-*NullSuffix CON (و‎ 


(VP (NullPrefixcActive*Verb-*Pastt*NullSuffix VRB (قال‎ 


(SBAR (NullPrefixtParticleNAASIKH-*NullSuffix CON j!) 
(S 


(PUNC MRK :) 


(NP 


(NP (NullPrefix*Noun*Pronoun-tNullSuffix SBJ ((ه‎ 


(NP (NullPrefixtNountNullSuffix PRD (((أمر‎ 
(VP (NullPrefixcActive*Verb-*Past*NullSuffix VRB ol) 
(NP (Definit-*NountNounInfinit*NullSuffix SBJ ((الأوان‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON J) 
(NP (NullPrefixtNountNounInfinit*NullSuffix 108 (افتتاح‎ 


(NP (NullPrefixtNountPronoun-*NullSuffix IDF ((((((((رف‎ 
(PUNC MRK .))) 


الوضوع TPC‏ 
تستخدم هذه العللامة à‏ حالة: 
e‏ ذا كان البتداً خبره ila‏ فعلية. 
"والاشجار تزدهر “ 
(ROOT‏ 
)۾ (S (NullPrefixtConj-*NullSuffix CON‏ 


(NP (Definit-Noun*Plural-NullSuffix TPC ((الأشجار‎ 


(VP (Present*Active*Verb-*NullSuffix VRB (تزدهر‎ ( 
(PUNC MRK .))) 


-۲ ۱۵ 


هذه | لطبعة 


اهدا 


ء من المركز 


ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


© إذا كان اسم كان» اسم ol‏ اسم كاد خبرها ila‏ فعلية. 
”وشدد التوضيح على أن الرئيس d‏ يعلن الطوارئ.“ 


Plural*NullSuffix OBj ((((((((الطوارئ‎ 


OBJ «المفعولية‎ 


9 


'ومارست حق الانتخاب à‏ هیئات 


(NullPrefix-*Noun-*No 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (NullPrefix*VerbtNullSuffix VRB (شدد‎ 
(NP (Definit-*NountNounInfinit*NullSuffix SBJ (التوضيح‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (علی‎ 
(SBAR (NullPrefixtParticleNAASIKH-*NullSuffix CON öf) 
(S 
(NP (Definit+Noun+tExaggAdj+NullSuffix_TPC ((الرئيس‎ 
(VP 
(PRT (NullPrefix*JAAZIMA*NullSuffix CON gJ)) 
(Present*Active*sVerb-4NullSuffix VRB (یعلن‎ 
(NP 
(NP (Definit-*Noun-*NoSARF- 
(PUNC MRK .))) 
تستخدم هذه العللامة؛ للد لالة على الفعول به:‎ 
عل“‎ 
(ROOT 
(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (NullPrefix+Verb+Past+Femin+Single VRB (مارست‎ 
(NP (NullPrefix-NountNounInfinittNullSuffix OBj (حق‎ 
(NP (Definit*Noun-*NounInfinittNullSuffix IDF (((الانتخاب‎ 
(PP (NullPrefixtPrepos*NullSuffix CON (في‎ 
(NP (NullPrefix*Noun*Femin*Plural IOB (هيئات‎ 
unInfinit-*Femin*Single MOD ((((عدة‎ E 
(PUNC MRK .))) 


21 ( 


هذه الطبعة 

إهداء من المركز 

ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


“فالبرغم من كونه تجاوز مرحلة الصبا والشباب إلى مرحلة كونه رجلا ناضجاء 
کین عمد رها اک 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON .3) 
(PP (NullPrefixtPrepos-*NullSuffix CON o) 
(NP 
(NP (Definit-*NountNullSuffix 108 (الرغم‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON ja) 
(S 
(VP (NullPrefixtNountNullSuffix IOB (کون‎ 
(NP (NullPrefix*Noun*Pronoun-tNullSuffix IDF ((ه‎ 
(NP (NullPrefix*VerbtNullSuffix VRB (تجاوز‎ 
(NP (NullPrefixtNoun*Femin*Single OBJ (مرحلة‎ 
(NP (Definit-*NountNullSuffix IDF (الصبا‎ 
(NullPrefixConj-4NullSuffix CON (و‎ (Definit*NountNounInfinitrNullSuffix NN ((((الشباب‎ 
(PUNC MRK ,) 
(PP (NullPrefixtPrepos-*NullSuffix CON (الی‎ 
(NP (NullPrefix-Noun*Femin*Single 108 il>) 
(S 


(VP (NullPrefixtNountNullSuffix IDF (کون‎ 
(NP (NullPrefix*Noun*Pronoun-*NullSuffix IDF ((ه‎ 
(NP (NullPrefix*NountMasc-*NullSuffix OBJ <y) 1 
lPrefixrtNoun*SubjNoun-*NullSuffix MOD (((((((((((ناضجا‎ 
(PUNC MRK ,) 
(PRT (NullPrefix*Conj-*NullSuffix CON ((ف‎ 
(VP (NullPrefix-ParticleNAASIKH-*NullSuffix VRB jù!) 
(NP (NullPrefix*Noun*Pronoun-tNullSuffix SB] ((ه‎ 


(S 


(VP (NullPrefixtVerbNAASIKH*NullSuffix VRB w) 
(NP (NullPrefix*Noun*tNullSuffix PRD (صلبا‎ (NullPrefixtNoun-cExag 
gAdjtNullSuffix MOD (عنيدا‎ (NullPrefixtNountSubjNoun4sNullSuffix MOD (مقاوما‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON J) 
(NP (Definit-NouncExaggAdj-*NullSuffix IOB ((((((الجدید‎ 


(PUNC MRK .)))‏ 
و فعل VRB‏ 
تستخدم هذه العلامة؛ للدلالة على الفعل بأنواعه الختلفة. 
"ویتنافس الرشحون على ۳۸۹ مقعدا.* 
(ROOT‏ 


(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (Present*Active*sVerb*NullSuffix VRB (يتنافس‎ 
(NP (DefinittNountObjNountPlural-MARF4MasctNonAdjunct SBJ ((المرشحون‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (علی‎ 
(NP (CD IOB 389) 
(NP (NullPrefix*Noun-*NullSuffix TMZ (((((مقعدا‎ 


(PUNC MRK .)))‏ 
«تمييز TMZ‏ 
تستخدم هذه العلامة؛ للدلالة على التمییز بأنواعه الختلفة. 
"وفشل ۱۳ حزبا وحركة آخری في الحصول على أي مقعد خلال الانتخابات 
التشريعية الأخيرة التي جرت عام ۲۰۰۲.* 


<< ۷ 


هذه الطبعة 

إهداء من المركز 

ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


fix+Conj+NullSuffix_CON (و‎ 
Prefix+Noun+NullSuffix_ VRB Jå) 


CD SBJ 13) 
(NullPrefixtNoun*NullSuffix TMZ (حزبا‎ (( 
PrefixtConj-*NullSuffix CON (و‎ 


(NullPrefix*Noun-*Femi 


(NullPrefixrtNoun-*Femin*Single NN (حركة‎ 


(ROOT 
(S (NullPre 
(VP (Null 

(NP 

(NP ( 
(NP 
(Null 
(NP 


n+Nul1Suffix MOD (((آخری‎ 


(PP (NullPrefixtPrepos-*NullSuffix CON (في‎ 
(NP 
(NP (Definit-*NountNullSuffix IOB (الحصول‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (علی‎ 
(NP (NullPrefix-Noun*Adjunct*NullSuffix IOB gi) 
(NP (NullPrefix*Noun-*NullSuffix IDF ((((((مقعد‎ 
(NP (NullPrefixtNountNullSuffix TMP (خلال‎ 
(NP 
(NP (Definit-*NountNounInfinittFemincPlural IDF (لانتخابات‎ (Defi 
nit-NountNounInfinittRelAdj*Femin*Single MOD (التشريعية‎ (DefinittNoun-*Ex 
aggAdj*Femin*Single MOD ((الأخيرة‎ 
(SBAR 
(WHNP (DefinitrNounc*RelPro*Femint*Single CON (التي‎ 
(S 
(VP (NullPrefix-Active*Verb-*Past*FemintSingle VRB )جرت‎ 
(NP (NullPrefixtNoun*NullSuffix OBJ عام‎ 
(NP (CD IDF 2002((((((((( 
(PUNC MRK .))) 


”وهنا یکون التحدي بالنسبة للمثل آکبر وأكثر تعقیذا.* 


(NullPrefixtConj-*NullSuffix CON (و‎ 


lPrefixtDZARF-*NullSuffix TMP Lia)) 
nt+Active+Verb+NullSuffix_VRB (یکون‎ 
nit-NountNounInfinittNullSuffix SBJ (التحدي‎ 
lPrefixtPrepos-4NullSuffix CON o) 


(DefinittNountFemin*Single IOB (النسبة‎ 


(NullPrefixtPrepos-NullSuffix CON J) 

P (DefinitrNoun*SubjNoun-*NullSuffix IOB (((((الممثل‎ 
(NullPrefix*Noun-NoSARF4NullSuffix PRD sÍ) 

*NullSuffix CON (و‎ (NullPrefix+Noun+NoSARF+NullSuffix NN (آکثر‎ 
(NullPrefix+Noun+NounInfinit+NullSuffix_TMZ (((((تعقيدا‎ 


2) 


-518- 


(ROOT 
(S 
(ADVP (Nul 
(VP (Prese 
(NP (Defi 
(PP (Nul 
(NP 

(NP 
(PP 
(N 

(NP 

(ADJP 
(NullPrefixtConj 
(NP 


(PUNC MRK 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


وص MOD‏ 
تستخدم هذه العلامة في عدة مواضع: 


7 


© النعت سواء آکان حقيقيًا أو سببيًا. 
"واحتل التجمع الوطني الديمقراطي الرتبة الثانية.“ 
(ROOT‏ 


(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (NullPrefix*VerbtNullSuffix VRB Jol) 
(NP (Definit-*NountNounInfinit*NullSuffix SBJ (التجمع‎ 
(DefinittNoun-RelAdj MOD (الوطني‎ (Translit MOD ((الديمقراطي‎ 
(NP (Definit-NountFemin*Single OBJ (المرتبة‎ (DefinitrNoun-cSubjNoun 
*FemintSingle MOD (((الثانية‎ 
(PUNC MRK .))) 


Ki‏ ۰ + جو 

JLI e‏ بانواعه الختلفة. 
edla”‏ جهاد إلى العمل Ere‏ 

(ROOT 

(S (NullPrefix+Conj+NullSuffix_CON (و‎ 


(VP (NullPrefix+Verb+Past+Femin+Single_VRB (وصلت‎ 
(NP (NullPrefix+Noun+NounInfinit+NullSuffix_OBj ((جهاد‎ 
(PP (NullPrefix+Prepos+NullSuffix_ CON (الی‎ 
(NP (NullPrefix+tNoun+tFemin+Plural_ IOB ((العمل‎ 
(NP (NullPrefix+tNoun+NounInfinit+Femin+Single_MOD (((مبكرا‎ 


(PUNC MRK .))) 
IDF إضافة‎ e 

تستخدم هذه العلامة؛ للدلالة على المضاف إليه. 

”وخرجت قوئ السلطة لتشكل المغارضة الديدة“ 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (NullPrefixcActive*Verb-*Past*FemintSingle VRB (خرجت‎ 
(NP (NullPrefix-Noun*Plural*NullSuffix SBJ (قوی‎ 
(NP (DefinittNoun*Femin*Single IDF (((السلطة‎ 
(VP (ParticleNAASSIB-«Presentt*ActivetVerb-*NullSuffix VRB (لتشکل‎ 


(NP (Definit-NounctFemin*Single OBJ (المعارضة‎ (DefinittNoun*Exagg 
Adj*Femin*Single MOD ((((الجديدة‎ 
(PUNC MRK .))) 
IOB جار وجرور‎ 9 


تستخدم هذه العلامة؛ للدلالة على الاسم الجرور. 

“فقد كانت وزيرة الخارجية كونديليزا رايس في منتهى الوضوح حين نظرت إلى 
حرب لبنان على أنها اللحظة التي نشهد فيها المخاض العسير لولادة الشرق الأوسط 
الكبير.“ 


ir 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 

أو تداولها تجاریا 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON .3) 
(VP 


PRT (NullPrefix*NoSyntaEffecttNullSuffix CON )قد‎ 


NullPrefix*tActive*Verb-*PasttFemintSingle VRB (کانت‎ 
NP 


(NP (NullPrefix4 
(NP 
(((الخارجية‎ 


(NP (Translit IDH (كونديليزا‎ (Translit NN (((رايس‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (في‎ 
(NP (NullPrefix4 
(NP 
(SBAR 


(NP (NullPrefix4 
(S 


(VP (NullPrefixtActive*Verb-*Past*FemintSingle VRB (نظرت‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (الی‎ 
(NP (NullPrefixtNountNullSuffix IOB (حرب‎ 
(NP (NullPrefix*NountNoSARF*FemintSingletNullSuffix IDF óU3 3) ))) 
(PP (NullPrefixtPrepos-*NullSuffix CON (علی‎ 


(SBAR (NullPrefixtParticleNAASIKH-*NullSuffix VRB öt) 
(S 


( 
( 
( 


-Noun+tExaggAdj+Femin+Single_SBJ (وزيرة‎ 
(Definit+Noun+SubjNoun+RelAdj+Femin+Single_IDF 


rNoun*ObjNoun-*NullSuffix IOB (منتهی‎ 
(Definit-Noun*NullSuffix IDF ((((الوضوح‎ 


-DZARF*NullSuffix TMP (حين‎ ( 


(NullPrefixtNoun*Pronoun*NullSuffix SBJ ((ها‎ 
(NP 


(NP (Definit-Noun*Femin*Single PRD (اللحظة‎ 
(SBAR 
(WHNP 
(S 


(VP (Present*Active*tVerb-*NullSuffix VRB (نشهد‎ 
(NP 


(Definit-NountRelPro4*Femin-c*Single CON (التي‎ 


(NullPrefixtPrepPronComp-*NullSuffix TMP 
(((فیها‎ 


(NP 
(NP 


(NP (Definit-*NountNounInfinit*NullSuffix OBJ 
(DefinittNoun*ExaggAdj-*NullSuffix MOD (العسیر‎ 


(PP (NullPrefixtPrepos-*NullSuffix CON J) 
(NP (NullPrefix*Noun-cFemin-*Single IOB 


(المخاض 


(ولادة 


(NP (Definit*NountNullSuffix IDF (الشرق‎ 
(Definit-Noun*NoSARF-*NullSuffix MOD (((((الأوسط‎ 


(ADJP (Definit+Noun+tExaggAdj+NullSuffix_MOD 
لكبير‎ 222900022000) 


(PUNC MRK .)) 


ده ۷ ۷ب 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


EMP التأكيد‎ e 

e‏ التوکید اللفظي 

e‏ الفعول الطلق المؤكد 

”ذلك القرار الذي تخطى خطوة تخطتها المرأة في السابق في هذا الصدد من خلال 
إنشاء فنادق للنساء فقط !.“ 


(ROOT 
(S 
(NP 

(NP 
(NP (NullPrefixtNountDemoPro-*Masc*Single-*NullSuffix SBJ (ذلك‎ ( 
(NP (Definit-*NountNounInfinit*NullSuffix IDH ((القرار‎ 

(SBAR 
(WHNP (DefinittNounc*RelPro*MasctSingle-*sNullSuffix MOD 4i!) 
(S 


(VP (NullPrefixtActive*Verb-*Pastt*NullSuffix VRB (تخطی‎ 
(NP (NullPrefixtNounNounInfinit*FemintSingle EMP (خطوة‎ ( 
(S 
(VP (NullPrefixtVerb*Pastt*FemincSingle VRB (خطت‎ 
(NP (NullPrefix-Noun*Pronoun-*NullSuffix OBJ ((ها‎ 
(NP (Definit-NountFemin4Single SBJ (المرأة‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (في‎ 
(NP (Definit-NountSubjNoun*NullSuffix 108 (((السابق‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (في‎ 
(NP 
(NP 
(NP (NullPrefixtNoun-*DemoPro-*MasctSingle-cNullSuff 


ix IOB ((هذا‎ 
(NP (Definit-*NountNullSuffix IDH (((الصدد‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON ja) 
(NP (NullPrefixtNountNullSuffix TMP (خلال‎ 
(NP (NullPrefixtNoun*NounInfinittNullSuffix IDF (انشاء‎ 
(NP 
(NP (NullPrefixtNoun*NoSARF4Plural*NullSuff 


ix IDF ((فنادق‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON J) 
(NP (Definit-NountPlural*NullSuffix IOB 
(((((((((النساء‎ 
(ADVP (NullPrefixtNoun-*NullSuffix MOD ((((((((فقط‎ 
(PUNC MRK 15) (PUNC MRK .))) 


TMB الزمان والکان‎ e 

تستخدم هذه العلامة للدلالة على الفعول فيه (ظرف الزمان والکان). 

"وفشل ۱۳ حزبا وحركة آخری في الحصول على أي مقعد خلال الانتخابات 
التشريعية الأخيرة التي جرت عام ۲۰۰۲.* 


2۳ 


هذه الطبعة 

إهداء من المركز 

ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON )۾‎ 
(VP (NullPrefix*NountNullSuffix VRB (فشل‎ 
(NP 
(NP (CD SBJ 13) 
(NP (NullPrefixtNountNullSuffix TMZ (حزبا‎ ( 
(NullPrefixtConj-*NullSuffix CON (و‎ 
(NP (NullPrefixtNounctFemin*Single NN (حركة‎ (NullPrefixtNountFemi 
niNullSuffix MOD (((آخری‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (في‎ 
(NP 
(NP (Definit-*NountNullSuffix IOB (الحصول‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (علی‎ 


(NP (NullPrefixtNoun*Adjunct*NullSuffix IOB gi) 
(NP (NullPrefix*Noun*NullSuffix IDF ((((((مقعد‎ 
(NP (NullPrefixtNountNullSuffix TMP (خلال‎ 
(NP 
(NP (Definit-*NountNounInfinittFemincPlural IDF (لانتخابات‎ (Defi 
nit-NountNounInfinittRelAdj-*Femin*Single MOD (التشريعية‎ (DefinittNoun-*Ex 
aggAdj*Femin*Single MOD ((الأخيرة‎ 
(SBAR 
(WHNP (DefinitrNounc*RelPro*Femint*Single CON (التي‎ 
(S 
(VP (NullPrefixtActive-*Verb-*Past*FemintSingle VRB )جرت‎ 
(NP (NullPrefixrNoun*NullSuffix OBJ عام‎ 
(NP (CD IDF 2002((((((((( 
(PUNC MRK .))) 


PRB السببية‎ e 
تستخدم هذه العلامة؛ للدلالة على المفعول لأجله.‎ 
”وأمي تمنعني من اللعب بها في الشارع؛ خوفا من السيارات“‎ 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(NP (NullPrefixtNoun-*NullSuffix TPC gi) 
(NP (NullPrefix*Noun*Pronoun-tNullSuffix IDF ))) 
(VP (Present*Active*Verb-*NullSuffix VRB (تمنع‎ 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix OBJ ((ي‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON ja) 
(NP (Definit-*NountNullSuffix IOB (اللعب‎ 
(NP (NullPrefix-PrepPronComp-*NullSuffix IOB (((بها‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (في‎ 

(NP (Definit-NountSubjNoun*NullSuffix IOB (((الشارع‎ 
(PUNC MRK ;) 
(NP 

(NP (NullPrefixtNoun*NullSuffix PRB ((خوفا‎ 

(PP (NullPrefixtPrepos-*NullSuffix CON ja) 

(NP (DefinitrNouncExaggAdj-*Femin*Plural IOB ((((((السیارات‎ 


IDH الایضاح‎ e 
تستخدم هذه العلامة في عدة مواضع:‎ 
عطف البیان‎ e 


”قال الحلل السياسي اللبناني الستقل سرکیس آبو زید علم.“ 


e‏ ی 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


(ROOT 
(S 
(VP (NullPrefixcActive*Verb-*Pastt*NullSuffix VRB (قال‎ 
(NP 

(NP (DefinitrNountSubjNoun*NullSuffix SB] (المحلل‎ 
(DefinittNountRelAdj MOD (السياسي‎ (DefinittNountNoSARF4FemintSingle*RelA 
dj MOD (اللبناني‎ (DefinitrtNoun*SubjNoun*NullSuffix MOD ((المستقل‎ 

(NP (Translit IDH (سركيس‎ (NullPrefixtNountNullSuffix NN آبوزید‎ ( 
(NullPrefixrtNoun*NullSuffix NN ((((علم‎ 


(PUNC MRK .)))‏ 
coe Lf"‏ إلى جنس النساء اساءة کری.* 


(ROOT 
(S 
(NP (NullPrefix*Verb*PasttFemin*Single VRB (أساءت‎ 
(NP 
(NP (NullPrefixtPrepos-*NullSuffix CON (الی‎ 
(NP (NullPrefixtNountNullSuffix IOB (جنس‎ 
(NP (Definit-NountPlural*NullSuffix IDF (((((النساء‎ 
(NP (NullPrefixtNountNounInfinit*Femint*Single IDH (إساءة‎ (NullPrefixt 
Noun*tFemintNullSuffix MOD (کبری‎ 


(PUNC MRK .)))‏ 
© الاختصاص 
“ونحن الحزب الوحيد الذي ترشح وهو ينتمي للاغلبية." 

(ROOT 


(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(NP (NullPrefix*NountSubjPro-*NullSuffix SBJ (نحن‎ ( 
(NP 
(NP (Definit-NountNullSuffix IDH (الحزب‎ (Definit*Noun*ExaggAdj-*Null 
Suffix MOD >!) 
(SBAR 
(WHNP (DefinittNounc*RelPro*Masc*Single-*NullSuffix MOD iJ!) 
(S 
(VP (NullPrefix*VerbtNullSuffix VRB (ترشح‎ 
(SBAR (NullPrefixtConj-*NullSuffix CON (و‎ 
(S 
(NP (NullPrefix*Noun*SubjPro-*NullSuffix TPC ((هو‎ 
(VP (Present*Active*Verb-*NullSuffix VRB (ينتمي‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (الی‎ 
(NP (Definit-*NountNoSARF-RelAdj-*FemincSingle IOB 
io:31))))))))) 
(PUNC MRK .))) 


e‏ البدل بأنواعه. 
وم يعاقبه الاتحاد الدولي لكرة القدم الفیفا.** 


2712 


هذه | لطبعة 


إهداء من الرکز 
ولایسمح بنشرها ورقياً 
أو تداولها تجارياً 
(ROOT‏ 
)۾ (S (NullPrefixtConj-*NullSuffix CON‏ 
(VP‏ 


(PRT (NullPrefix*JAAZIMA*NullSuffix CON gJ)) 
(PresenttActive*Verb-*NullSuffix VRB (یعاقب‎ 
(NP (NullPrefix*Noun*Pronoun-tNullSuffix OBJ ((ه‎ 
(NP 
(NP 
(NP (Definit-*NountNounInfinit*NullSuffix SBJ (الاتحاد‎ 
(Definit-*Noun*Plural*RelAdj MOD (الدولي‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON J) 
(NP (NullPrefix*Noun-*Femin-*Single IOB ös) 
(NP (Definit-Noun*NullSuffix IDF ((۱(((القدم‎ 
(NP (Translit IDH ((((الفیفا‎ 


(PUNC MRK .))) 


NN التلازم‎ ۰ 

تستخدم هذه العلامة؛ للدلالة على آحد آجزاء التلازم التركيبي (البنية السطحة) O‏ الذي 
یکون في حکم الفرد i ed‏ والذي یتمثل في بنية مسطحة وفق التنظیم البنائي للم رکبات. 

0 أسماء الاعلام المركبة تر GS‏ إسناديًا. 

”أكد الناقد السينائي السعودي خالد ربيع السید» أن مهرجان جدة الثالث للأفلام» 
أخذ الأهمية الكبرى عن التجربتین السابقتین.* 


(ROOT 
(S 
(VP (NullPrefix*Verb*NullSuffix VRB (أكد‎ 
(NP 
(NP 
(NP (Definit-NountSubjNoun*NullSuffix SBJ (الناقد‎ (Translit 
MOD ((السينمائي‎ 
(ADJP (Definit-Noun-*RelAdj MOD (((السعودي‎ 

(PUNC MRK ,) 

(NP (NullPrefixrNoun*SubjNoun-*NullSuffix IDH Ls) 
(NullPrefixtNounc*ExaggAdj-*NullSuffix NN (ربیع‎ 
(DefinittNoun*ExaggAdj*NullSuffix NN (((السيد‎ 

(PUNC MRK ,) 
(SBAR (NullPrefixtParticleNAASIKH-4NullSuffix VRB (أن‎ 
(S 
(NP 
(NP (NP (NullPrefix*Noun-*NullSuffix TPC (مهرجان‎ 
(NP (NullPrefix*Noun*Femin*Single IDF 342))) (ADJP (Defi 
nitrNountSubjNoun*NullSuffix MOD (((الثالث‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON J) 
(NP (Definit-Noun*NullSuffix IOB ((((الأفلام‎ 
(PUNC MRK ,) 
(VP (NullPrefixtActive-*Verb-*Past*NullSuffix VRB &zd) 
(NP (Definit-NountNoSARF-RelAdj-*FemincSingle SBJ (الأهمية‎ 
(Definit+Noun+Femin+NullSuffix_MOD (الكبرى‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON ġe) 
(NP (Definit*Noun-*NounInfinit*Feminc*Binary-*NonAdjunct-*MANS 
S*MAGR IOB (435,23!) (Definit+Noun+tSubjNoun+tFemin+Binary+NonAdjunct+MA 
NSS*MAGR MOD (((((((السابقتین‎ 


(PUNC MRK .))) 


(۱) يقصد بالبنية السطحة البنية التي توازي بين أحد أجزائهاء بحیث تکتسب کل الأجزاء صفة الابن لرأس المركب. 
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هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


© الأسماء المبنية على فتح الجزأين. 


”مر واحد وثلاثون عاما على التحاقى بالعمل الاجتتاعى» حيث بدأته وأنا ابنة 


السابعة عشرة.“ 


llSuffix VRB (مر‎ 
|Suffix SBJ (و احد‎ 
FNullSuffix CON (و‎ (NullPrefixtNoun*Plural*MARF-4Masc-tNonA 


|llPrefixrtNoun*NullSuffix TMZ ((عاما‎ 


(NullPrefixtPrepos-*NullSuffix CON (علی‎ 


|llPrefixtNoun-*NounInfinitrNullSuffix IOB (التحاق‎ 


(NullPrefixtNoun*Pronoun-*NullSuffix IDF (ي‎ ( 
(NullPrefixt*Prepos-4NullSuffix CON 4) 


(Definit4*NounNounInfinit4 

lAdj MOD (((((الاجتماعي‎ 
) 

4 


-NullSuffix IOB (العمل‎ 


(NullPrefixtDZARF-*NullSuffix TMP (حیث‎ ( 


(NullPrefix+Active+Verb+Past+Nul 
(NullPrefix+Noun+SubjNoun+Null 


(ROOT 
(S 

(VP 
(NP 
(NullPrefix+Conjṣ4 
djunct NN (ثلاثون‎ 
(NP (Nul 
(PP 
(NP (Nul 
(NP 
(PP 
(NP 
(Definit4*Noun-*Rel 
(PUNC MRK 

(SBAR 
(WHADVP 

(S 


(VP (NullPrefixtActive4Verb*Past*SubjPro VRD (بدأت‎ 


(NullPrefixtNoun*PronountNullSuffix OBJ ((ه‎ 


(NP 


(NullPrefixtConj-*NullSuffix CON (و‎ 


(S 
(NP (NullPrefix-Noun*SubjProtNullSuffix SBJ (أنا‎ 
(NP (NullPrefix-Noun*Femin*Single PRD (ابنة‎ 
(NP (Definit*NountSubjNoun*FemintSingle IDF (السابعة‎ 


(NullPrefixtNoun*FemintSingle NN ((((((((عشرة‎ 


) 
"HO TE‏ 
"دياسطي وبسنت لعب اق منتهی E‏ 


(NullPrefixtConj-*NullSuffix CON (و‎ 


(Translit SBJ (دياسطي‎ 


(PUNC MRK .) 


(ROOT 
(5 
(NP 


(Translit NN (بسنت‎ ( 


(NullPrefixrtNoun-*NullSuffix PRD (لعب‎ 
(NullPrefixtPrepos-NullSuffix CON (في‎ 
(NullPrefixtNoun*ObjNoun-cNullSuffix (منتهی‎ 
(Definit+Noun+RelAdj+Femin+Single (((((الجدية‎ 


)) 


VRD jel joe 


(NP 
(PP 
(NP 

(NP 


(PUNC MRK .) 


تستخدم هذه العلامة؛ للدلالة على الافعال المسندة للضمائر التصلة البنية في محل 


رفع فاعل. 
"واستمر الزعاء التقلیدیون من آداروا اجرب الا هل مسکین 


ره ی ۳ 


بزمام الأمور.“ 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (NullPrefix*VerbtNullSuffix VRB (استمر‎ 
(NP 
(NP (Definit-NountNoSARF-*Plural*NullSuffix SBJ (الزعماء‎ (Definit-* 
NountNounInfinitt*Plural*MARF-RelAdj-*Masc*NonAdjunct MOD (التقلیدیون‎ 
(SBAR 
(WHNP (NullPrefixtPrepos-*Noun*RelProtNullSuffix IOB ((ممن‎ 
(S 
(VP (NullPrefixtActive*VerbtPasttSubjPro VRD (آداروا‎ 
(NP (Definit-NountNullSuffix OBJ (الحرب‎ (DefinittNoun*RelAd 
j*FemintSingle MOD ((الأهلية‎ 
(S 


(VP (NullPrefix+Noun+SubjNoun+Plural+Masc+NonAdjunct+MA 
NSS*MAGR MOD (ممسکین‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON o) 
(NP (NullPrefixtNountNullSuffix IOB (زمام‎ 
(NP (Definit*Noun-NullSuffix IDF (((((((((((الأمور‎ 
(PUNC MRK .))) 


CON ربط‎ 

تستخدم هذه العلامة لجميع آدوات الربط: 

e‏ آدوات العطف 

"و تحولت الحکمة إل ورقة بید الصراعات الوا“ 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (NullPrefixtVerbt*Pastt*FemincSingle VRB (تحولت‎ 
(NP (Definit*NouncFemin4Single SBJ ias!) 
(PP (NullPrefixtPrepos-*NullSuffix CON (الی‎ 
(NP 
(NP (NullPrefix*Noun*Femin*Single IOB ((ورقة‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON o) 
(NP (NullPrefixrNoun*Femin-NullSuffix IOB (ید‎ 
(NP (Definit-NountFemin*Plural IDF (الصراعات‎ (DefinittNoun 
*RelAdj*Femin*Single MOD (((((((الدولية‎ 
(PUNC MRK .))) 


۰ آدو ات نصب الفعل الضارع 
”ل تصطد معهم آبدا.“ 
لن (ROOT ۱ j‏ 


(VP 
(PRT (NullPrefix*ParticleNAASSIB-*NullSuffix CON ((لن‎ 
(PresenttActive*Verb-*NullSuffix VRB (نصطدم‎ 
(NP (NullPrefix-DZARF-Adjunct*NullSuffix TMP (مع‎ 
(NP (NullPrefixtNoun*Pronoun-tNullSuffix IDF ga»))) 
(NP (NullPrefixtNoun*NullSuffix TMP (((أبدا‎ 
(PUNC MRK .))) 


ی 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


»وا والحال 
“ونحن الحزب الوحيد الذي ترشح وهو ينتمي للاغلبية." 
(ROOT =‏ 


(S (NullPrefix+Conj+NullSuffix_CON (و‎ 
(NP (NullPrefix+Noun+SubjPro+NullSuffix_SBJ (نحن‎ ( 


(NP 
(NP (Definit+Noun+NullSuffix_IDH (الحزب‎ (Definit+Noun+tExaggAdj+Null 
Suffix MOD (الوحید‎ 
(SBAR 
(WHNP (DefinitrNoun-*RelPro*MasctSingle-*NullSuffix MOD iJ!) 
(S 
(VP (NullPrefix*VerbtNullSuffix VRB (ترشح‎ 
(SBAR (NullPrefixtConj-*NullSuffix CON (و‎ 
(S 
(NP (NullPrefix*Noun*SubjPro-*NullSuffix TPC ((هو‎ 
(VP (Present*Active*Verb-*NullSuffix VRB (ينتمي‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (الی‎ 
(NP (Definit-*NountNoSARF-RelAdj-*FemincSingle IOB 
(((((((((الأغلبية‎ 
(PUNC_MRK .))) 
واو الفعولية‎ © 
ec "a 5 و‎ 9 
وشدد التوضيح على أن الرئیس لم يعلن الطوارئ والمساء.‎ 
(ROOT 


(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (NullPrefix*VerbtNullSuffix VRB (شدد‎ 
(NP (Definit-*NountNounInfinit*NullSuffix SBJ (التوضيح‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON (علی‎ 
(SBAR (NullPrefixtParticleNAASIKH-4NullSuffix VRB (أن‎ 
(S 
(NP (Definit-*NouncExaggAdj-*NullSuffix TPC (الرئيس‎ 
(VP 
(PRT (NullPrefix*JAAZIMA-*NullSuffix CON gJ)) 
(Present*Active*sVerb-4NullSuffix VRB (یعلن‎ 
(NP (Definit*NountNoSARF-*Plural*NullSuffix OBJ 
(((الطواری‎ 
(NullPrefixtConj-*NullSuffix CON (و‎ 
(NP (Definit*Noun-* NullSuffix OBJ ((المساء‎ )))) 
(PUNC MRK .))) 


« حروف الجر 
"وهی الحالات التاريخية لعمل المرأة. “ 


(ROOT 
(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(NP (NullPrefixtNountSubjPro-*NullSuffix SBJ ((هي‎ 
(NP 
(NP (Definit-NountFemin*Plural PRD (الحالات‎ (Definitt*NountRelAdj-Fe 
1011۴510916 MOD (التاريخية‎ 
(PP (NullPrefixtPrepos-*NullSuffix CON J) 
(NP (NullPrefixtNounNounInfinit*NullSuffix IOB Jae) 
(NP (Definit-Noun*Femin*Single IDF 8| a10))))) 
(PUNC MRK .))) 


ev y= 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


« آدوات الشر ط 
"و إذا كانت الا ار Susi Lac‏ الور“ 
(ROOT‏ 


(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(SBAR (NullPrefix*CondNotJAAZIMA-NoSyntaEffect4NullSuffix CON | 31) 
(S 
(VP (NullPrefixcActive-*Verb-*Past*FemintSingle VRB (کانت‎ 
(NP (Definit*Noun-Plural-NullSuffix SBJ ((الأخبار‎ 
(ADJP (NullPrefixtNounc*RelAdj-*Femin*Single PRD (((((سلبية‎ 
(PRT (NullPrefix*Conj-*NullSuffix CON .3)) 
(VP (Future-Present*Active*Verb4NullSuffix VRB (ستتأثر‎ 
(NP (Translit SBJ (((البورصة‎ 


(PUNC MRK .))) 


e‏ آدوات الاستثناء 
”فليس هناك هذا العائد» إلا في أ 


CC ۰ 
(ROOT » 
(S (NullPrefixtConj-*NullSuffix CON .3) 
(VP (NullPrefixtVerbNAASIKH-*NullSuffix VRB gia) 

(ADVP (NullPrefix-DZARF-*NullSuffix PRD (هناك‎ ( 

(NP 
(NP (NullPrefixtNountDemoPro-*Masc*Single*NullSuffix SBJ (هذا‎ ( 
(NP (Definit-NountSubjNoun*NullSuffix IDH (((العاند‎ 

(PUNC MRK ,) 
(PRT (NullPrefix-Except-*NullSuffix CON Yl)) 
(NullPrefixtPrepos-*NullSuffix CON (في‎ 

(NP (NullPrefixtNoun*Plural*NullSuffix IOB gi) 
(NP (Definit-NountPlural*NullSuffix IDF giaJ!))))) 


(PUNC MRK .))) 


MRK علامة‎ e 
à علامات الترقيم والرموز الرياضية المستخدمة‎ e تستخدم هذه العلامة‎ 
NT 
"ویرآس الوزارة مسلم سني ومجلس النواب مسلم شيعي.*‎ 
(ROOT 


(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(VP (Present-Active*Verb4*NullSuffix VRB wÍ )يڙ‎ 
(NP 
(NP (Definit*NounctFemin4Single OBJ (الوزارة‎ 
(NP (NullPrefixtNountSubjNoun-*NullSuffix SBJ pwo) 
(NullPrefixrtNounc*RelAdj MOD (سني‎ ( 
(PUNC MRK ,) (NullPrefix*Conj-*NullSuffix CON (و‎ 
(NP (NullPrefixtNountNullSuffix NN (مجلس‎ 
(NP (DefinitrNountPlural-*NullSuffix IDF (((النواب‎ 
(NP (NullPrefixtNountSubjNoun*NullSuffix SBJ (مسلم‎ 
(NullPrefixrtNoun-*RelAdj MOD ((((شيعي‎ 
(PUNC MRK .))) 


ihr 


إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 
.e‏ عناصر هيكلة البناء النحو ی 
يتم تنظیم البنية التركيبية للجملة في البناء الشجري - كما ظهرت في الأمثلة السابقة 
- من خلال بنيتي العوامل والوصف اللتین تفرضها النظرية النحوية على تشکیل 
عناصر ال رکبات الاساسية CN‏ الفعلية والاسمية» وذلك في إطار القوالب التنظيمية 
۱-۵ بنية العوامل Arguments structure‏ 
تحدد النظرية النحوية العوامل التى یتطلبها الحمول Predicate‏ سواء آکان اسا 
أو فعلا. 
* الفعل أو ال رکب الفعلى 
oc‏ دلالة الفعل أو الرکب الفعلى عددًا من العوامل مثل: 
- المركب الاسمی (الفاعل (SBJ‏ 
- ال رکب الاسمی (الفعول (OBJ‏ 
- ال رکب الحرفي ( الفعول غير الباشر (IOB‏ 
- الجملة التكميلية ila)‏ الصلة (SBAR‏ 
وتتدرج هذه العوامل في البنية الشجرية في الستوی الذي يلي الرکب الفعلي أي آبناء 
لهذا المركب» وأخوات لرآسه؛ أي الفعل. 
"فقدم الصورة الصحيحة للصوفية» حيث اکتظاظها بالعدید من البدع.“ 
(ROOT‏ 
(S (NullPrefix*Conj-*NullSuffix .3)‏ 


(VP (NullPrefixtVerbtNullSuffix (قدم‎ 
(NP 
(NP (DefinitrNoun*Femin*Single الصورة‎ ( (DefinitktNoun*ExaggAdj-*Fe 
mincSingle (الصحيحة‎ 
(PP (NullPrefix*Prepos-*NullSuffix J) 


(NP (Definitc*Nounc*RelAdj-*FemintSingle ((((الصوفية‎ 
(PUNC MRK ;) 
(SBAR 
(WHADVP (NullPrefixtCondJAAZIMA*DZARF4*NullSuffix (حیث‎ ( 
(S 
(NP 
(NP (NullPrefixtNoun*NounInfinit*NullSuffix (اکتظاظ‎ 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix (((ها‎ 
(PP (NullPrefix*Prepos*tNullSuffix )بې‎ 
(NP 
(NP (Definit*Noun-*ExaggAdj-*NullSuffix (العدید‎ 
(PP (NullPrefixt*Prepos-*tNullSuffix jn) 
(NP (Definit-*NountNullSuffix g..1!))))))))) 
(PUNC MRK .))) 


ir 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


« الاسم أو الرکب الاسمي 

تعيّن دلالة الاسم أو المركب الاسمي بنية العامل المتمثلة في: 

ه المركب الاسمی ( SLAM‏ إليه (IDF‏ 

ويتدرج هذا العامل (المكمل) في البنية الشجرية في المستوى الذي يلي المركب 
الاسمي أو الاسم (الرآس) أي يكون ابنا لرأس المركب الاسمي. 

“سر الانتصار.“ 


(ROOT 
(FRAG 
(NP (NullPrefixtNoun-*NullSuffix jw) 
(NP (Definit*Noun*tNounInfinit*NullSuffix (((الانتصار‎ 
(PUNC MRK .))) 


Adjunct Structure الوصف‎ 4 ۲-۵ 

تعددت آضرب الوصف أو التوسعة التي ترتبط بالفعل أو الرکب الفعلي و الاسم 
أو الرکب الاسمي؛ لتقوية العنی» وتحديد الأبعاد التي يسعى إليها التکلم. 

« الفعل أو المركب الفعلى 

يتوسع الفعل في تكوين علاقات تركيبية (فضلة)؛ للزيادة في العنی» مثل : 

-المركب الاسمي caes tll)‏ التمييزء الإيضاح) 

- المركب الحرفي 

-المركب الظرفي 

وتشغل هذه المركبات المستوى الذي يلي الرکب الفعلي في البنية الشجرية. 


- 


"وحاول تنوع مصادرهاء» بدلا من الاعت‌اد على مصدر واحد فقط هو البترول.“ 


(ROOT 
(S (NullPrefixt*Conj-*NullSuffix (و‎ 
(VP (Present*Active-*Verb4tNullSuffix (تحاول‎ 
(NP (NullPrefixtNountNounInfinit*NullSuffix (تنویع‎ 
(NP (NullPrefixtNoun*NoSARF-Plural*NullSuffix (مصادر‎ 
(NP (NullPrefixtNoun*Pronoun-*NullSuffix La)))) 
(PUNC MRK ,) 
(NP 
(NP (NullPrefixtNoun-*NullSuffix (بدلا‎ ( 
(PP (NullPrefixtNullSuffix jn) 
(NP 
(NP 
(NP 
(NP (Definit*Noun-*NounInfinit*NullSuffix ((الاعتماد‎ 
(PP (NullPrefixtPrepos-*NullSuffix (علی‎ 
(NP (NullPrefix-Noun-*NullSuffix (مصدر‎ (NullPrefixtNoun-* 
SubjNoun-*NullSuffix (واحد‎ (NullPrefixtNoun*NullSuffix (فقط‎ ( ( 
(NP (NullPrefix*Noun*SubjPro*NullSuffix (((هو‎ 
(NP (Translit (((((رالبترول‎ 
(PUNC MRK .))) 


ire 


هذه الطبعة 

إهداء من المركز 

ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


«الاسم أو الرکب الاسمي 

يتوسع الاسم بنشوء علاقة وصفية بين النعت والنعوت؛ لازالة الامهام» وبيان 
المعنى» مثل: 

«الرضف فر کب الففة) 

- المركب الحرفي ( في حالة كونه وصا) 

-الوصف الذي يصف ال رکب الاسمي (MOD)‏ 

وتشغل هه الرکبات الستوی الذي یل الرکب الاسمی في البنية الشجرية» Opa‏ 
الاسم الضاف إليه ( عامل الاسم) آي iud‏ مسطحة Flat Structure‏ 

"حزب التجمع الوطني الديمقراطي.* 

FRAG 

UNE (DetinitrNouncounInfniteNullSuffik gasill) (DeünitsNountRelAdj 


(((الديمقراطي (Translit‏ (الوطني 
(PUNC MRK .)))‏ 


ety e 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


هذه الطبعة 
إهداء من المركز 
ولايسمح بذ شرها ورقياً 
أو تداولها تجارياً 


الفصل الرابع 


ترميز البنك الشجري النحوي 


يعنى ترميز البنك الشجري النحوي بتحويله من صورته الأساسية أي الأقواس 
التركيبية Syntactic Bracketing‏ با تتضمنه من معلومات نحوية إلى صورة نصية 
مذيلة بمعلومات رئيسية حول العناصر الأساسية المكونة للتحليل الشجري» وذلك 
باستخدام لغة ترميز قياسية» قادرة على ترميز العديد من البيانات المختلفة. 

وتعد لغة الترميز القابلة للامتداد Extensible Markup Language (XML)‏ 
لغة توصيفية مثالية» حيث تدم نظام الحرف الدولي امو خد للغات الطبيعيةء فصلا عن 
أن لديها القدرة على تمثيل جميع آنواع الوثائق النصية» وقواعد البيانات» ولديها قابلية 
التعامل مع جميع الأنظمة الحاسوبية.”) 

وتظهر أهمية ترميز المدونات اللغوية بشكل عام عند توظيفها أو استدعائها في الآليات 
البرمجية التي تتطلب معلومات تييزية حول نصوص هذه المدونات» مثل: حدود الفقرة» 
() هي في الأساس مجموعة قواعد مبسطة من لغة الترمیز ذات المعيار العمم Standard Generalized Markup‏ 
(501) التي أنشئت في بدايات الشانیات من القرن النصرم» وعلى الرغم من زيادة الطلب علیها آنذاك في تخزین البیانات 
وتنظیمها إلا أا كانت لدا بعض الثغرات في تنظیم نصوص صفحات الویب؛ الأمر الذي أدى إلى انبثاق لغة الترمیز 


القابلة للامتداد منها؛ لحل هذه الثغرات. ينظر: 
Birbeck, M. & Others. (2001). Professional XML 2nd Edition. Published by Wrox‏ 


.Press Ltd, the United States. P.5-8 


sy 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


حدود الجملة» حدود الکلام فواصل الفقرة»...إلخ, OY‏ النص العادي Y Plain Text‏ 
يقدم هذه العلومات البسيطة للالیات البرمجية المختلفة. فالهدف من الترميز هو وصف 
البیانات وتنظیمها» بحیث یمکن استدعاژها بسهولة لدی الأنظمة احاسوبية. 


۱- لغة الترمیز القابلة للامتداد XML‏ 

هي جموعة من العناصر والوسوم يتم نظمها وفق Ael‏ کتابية معينة على النص 
راد ترمیزه» وتتمثل هذه الوسوم بين الأقواس المثلثة < الوسم > لتعبّر عما هو خارجها 
أو تذل عليه. ”“ ویمکن توضیح ذلك من خلال تطبیق الوسم الذي يشير إلى حدود 
احملة: <S>‏ على الثال التالي: 

”هذه ظاهرة قد يسببها اخوف. یتوقع حللون سیاسیون أن یکون هادئا.“ 

وباستخدام XML‏ يمكن تحديد حدود الجملة: 

<S>‏ هذه ظاهرة قد يسببها الخوف. «S7‏ <5> يتوقع محللون سياسيون أن يكون 
<S>. bsla‏ 

ویمکن أن تضاف العدید من الوسوم العبرة عن دلالات النص أو الرمز أو قواعد 
البيانات داخل وثيقة XML‏ وفق ضوابط ترتيبية معينة من خلال نظمها في ملف تعريفي 
یدعی بتعریفات نوع الوثبقة (DTD) Document Type Definitions‏ یتضمن تلك 
الوسوم بضوابطها التي یستوجب على ملف XML‏ اتباعها. 

ويتم ربط ملف تعریفات نوع الوثيقة النفصل بمستندات XML‏ من خلال كتابة 
مساره داخل الملف الذي یقوم بعمل Parsing | |J‏ للملف النصي الراد هیکلته بلغة 
الترمیز القابلة للامتداد. 


(1) Gulbransen, D. ) 2002).Ibid.P.9. 


A 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


۲- ترميز البنك الشجري النحوي بلغة XML‏ 

تم ترميز البنك الشجري النحوي بلغة الترميز القابلة للامتداد XML‏ باستخدام 
ملف تعريفات نوع الوثيقة ODTD‏ الخاص بمشروع البنك الشجري الالاني O‏ 
TIGER.‏ الذي يتضمن بيانات تعريفية حول تحليلات التقويس النحوي للجمل. مرتبة 
كالاق: 

Corpus ID تعريف المدونة‎ e 

° الرقم الترتيبي للجملة Sentence ID‏ 

.Graph root مدید نقطة بداية الجملة‎ e 

e‏ تحديد الاجزاء التي تتضمنها العقد النهائية Terminal‏ في التقویس, والتي 


اشتملت على: 
* الرقم الترتيبي للكلمة في الجملة 51_3 ,2 1,81 $1 
e‏ الكلمة Word‏ 


POS الأقسام الكلامية‎ e 
التقویس؛‎  NoN- Terminal تحديد الأجزاء التي تتضمنها العقد غير النهائية‎ e 
والتي اشتملت عل:‎ 
S1 500, 81_502 والذي يبدأ من الرقم ۵۰۰ مثال ذلك‎ Node الرقم الترتيبي للعقدة‎ * 
الفئة التركيبية التي تقابل رقم العقدة.‎ e 
التي اعتمدت‎ DTD جزءًا من ملف تعريفات نوع الوثيقة‎ EV ويوضح الشكل رقم‎ 
KML عليها الدراسة في تحديد عناصر تنسيق ملف‎ 


() اللف الذي يعني بوصف التحليل النحوي في المدونة اللغوية. 


(۲) ينظر: 
TIGER Corpus. (2003). http://www.ims.uni-stuttgart.de/forschung/ressourcen/korpora/tiger.en.html‏ 


sas 


هذه الطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقیا 
أو تداولها تجاریا 
declaration of the root element: corpus -->‏ --!< 
<xsd:element name-"corpus"?‏ 
«xsd:complexType»‏ 
<xsd: sequence?‏ 
«xsd:choice»‏ 
header of the document is optional -->‏ --!€ 
<xsd:element name-"head" type-"headType" minOccurs-"0" maxOccurs-"1"/»‏ 
</xsd:choice>‏ 


<xsd:element name="body" type="bodyType" minOccurs="1" maxOccurs="1"/> 


</xsd:sequence> 


l corpus ID 
<xsd:attribute name="id" type="idType" use="required" /> 
<!-- optional attribute: TigerXML version; used by TIGERSearch only ==> 


«xsdiattribute name="version" type="xsd: string" usec'optional" /»‏ 
«/xsd: complexType?‏ 
</xsd:elenent>‏ 
الشکل: 4 نموذج من تعريفات نوع الوثيقة (DTD‏ 
يمثل الشكل السابق تعريفات عنصر الدونة إذ يتضمن السات attributes‏ التي 
تشكل عنصر تعريف ال مدونة التمثلة في الاسم- ID‏ ونوع الاسم = idtType‏ من حيث 
كونه (سلسلة نصية أو رقمية) وإدخال الستخدم هذا الاسم Required‏ 
ثم استخدمت الدراسة أداة -"TIGERRegistry‏ المتضمنة في أدوات بحث تايجر 
5 الخاصة بالبنك الشجري الألماني - باعتبارها محللا Parser‏ 
لستند الوثيقة بلغة XML‏ وذلك في إطار ملف تعريفات نوع الوثيقة DTD‏ 
ويوضح الشكل رقم £V‏ أداة TIGERRegistry‏ أثناء تحويلها للملف الشجري 
(التقويسي) آدناه إلى ملف بصيغة لغة الترميز القابلة للامتداد XML‏ 


(Y)‏ للاطلاع على تعريفات الوثيقة: 
TIGER DTD. (2003).www.ims.uni-stuttgart.de/forschung/ressourcen/korpora/tiger.en.html‏ 


(Y)‏ هي أداة من ضمن حزمة package‏ آدوات النظام الألماني البحثي TIGERSearchTools‏ الذي ole y‏ معهد معالجة اللغة 
الطبيعية بجامعة شتوتغارت University of Stuttgart‏ والذي مهدف إلى البحث في الدونات اللغوية العنونة لا سيم| التركيبية. 


ی لب 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


”و هو رهان شجاع واثقء مرة آخری." إسلام آون لاين- ۸ ۰ 


(S (NullPrefixtConj-*NullSuffix CON (و‎ 
(NP (NullPrefixtNoun*SubjPro-*NullSuffix SBJ 33)) 
(NP (NullPrefixtNountNullSuffix PRD (رهان‎ 
(NP : 

(ADJP (NullPrefixtNountNullSuffix MOD (شجاع‎ 
(NullPrefixtConj-*NullSuffix CON (و‎ 
(NullPrefixtNoun*SubjNoun-*NullSuffix COJ àj!3)))) 

(PUNC <) 
(NP 
(NP (NullPrefixtNoun*Femin*Single MOD $52)) ۱ 
(ADJP (NullPrefixtNoun*Femin-*NullSuffix MOD 6531))) 
(PUNC  .)) 


Corpus Folder Options Help 
4 # ۵ لا نا‎ ۵ ۵ 


Import file 
honelahmedOesit op/TIGERSearchToolS/SATS IQ, Sys 2015_0068 tree Choose 
Import filter J general Penn treebank format fiter v 


Convert corpus graphs all * 


TIGERAOML file 
honelahmedOe5 Choose 
x; GZip XML file te XML file after indexing 
External Header 
L btended Indexing (increased query processing efficiency) 


Start Cancel 


DS, we 


الشكل:۷٤‏ آداة TIGERRegistry‏ الألمانية ° 


يظهر في الشاشة السابقة خطوات ترميز أو تحويل ملفات آقواس التحليل إلى ملفات 
à‏ بصيغة XML‏ والتی تمثلت فيا يل: 


)١(‏ يمكن تحميله من خلال هذا الرابط: 
TIGERRegistry. (2003). www.ims.uni-stuttgart.de/forschung/ressourcen/werkzeuge/tigersearch.html‏ 


i2 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


Corpus ID ادخال تعریف الدونة‎ e 

* تحدید مسار اللف التحلیل الراد تحویله. 

* تحديد نوع الأقواس التبعة في الملف. 

(KML م‎ 3E تحدید مسار اللف الحول إلبه (ملف‎ e 

ويتم عرض ملف XML‏ من خلال حررٍ نصوص مثل Ct Notepad‏ أو متصفح 
ويب مثل Firefox‏ أو Chrome‏ أو غبره» کا بالشكل رقم ٤۸‏ : 


<?xml versionz"1.0" encodingz"ISO-8859-1" standalone="no"?> 


"http://mnt.N3.0rg/2001/XMLSchema-ins tance" 
seSchemaLocation=" . /schema/TigerXML . xsd" 


«corpus x 


<head external-"file:/home/ahmed/TIGERSearchTools/CRF SATB generated header.xml"/» 
«body» 
«s ids"sl" > 
Xgraph roote"s] 500" > 
«terminals» 
«t ide"sl 1" wo NullPrefix*Conj*NullSuffix CON" /» 
s"Present*ActivesVerbsNullSuffix VRB" /» 
"NullPrefix*Noun*Femin*Single SBJ" /» 
NullPrefix*Noun*NullSuffix IDF" /< 
s"NullPrefixsNoun*NullSuffix IDF" /< 
="CD_OBJ" /» 
sz"NullPrefix*NountNullSuffix TMZ" /< 
PUNC " /< 


words"100" ع‎ 
worde" "جنيه‎ 


words"." po 


«/terminals» 
«nonterminals;| 

«nt id-"sl 506" cat-"NP" > 
«edge idrefs"sl 5" labels"--" /» 

€«/nt» 

«nt ide"sl 505" catz"NP" > 
«edge idr "sl 4" labe 
«edge idref-"s1 506" label-"--" /» 

«/nt» 

«nt id-"sl 508" cat-"NP" > 
«edge idrefs"sl 7" labels"--" /< 

«/nt» 

«nt ide"sl 507" catz"NP" > 
«edge idrefs"sl 6" label 
«edge idref-"s1 508" label-"--" /> 

«/nt» 

«nt id-"sl 504" cat-"NP" > 
«edge idref-"s1 505" labelz"--" /» 
«edge idrefz"sl1 507" labelz"--" /> 

«/nt» 

«nt ide"s] 503" cats"NP" > 
«edge idrefs"sl 3" labels"--" /» 


«edge idrefz"si 502" labelz"--" /> 
«edge 1 7" labelz*--" /> 
«edge idrefz"sl S05" labelz"--" /» 
«edge idrefz"sl 10" labelz"--* /> 
«Int» 
«/nonterminals» 
«/grapb» 
«s» 
</body> 
</corpus> 


£A: JS‏ نموذج من ترميز البنك الشجري بلغة الترميز القابلة للامتداد 


miii 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


وبملاحظة المثال السابق نجد ما یل: 

« تحقق تعريفات نوع الوثيقة DTD‏ -داخل ملف الترميز 26011 التي انتهجتها الذراسة. 

Syntactic Arabic Treebank (s 5JI بالبنك الشجري‎ ID تسمية وسم المدونة‎ © 
SATB) 

* ترقیم العقد النهائية وغير النهائية من الأعلى إلى الاسفل مبتدئة من الرقم ۵۰۰. 

© ترتیب وحدات الجملة ترتیبا تسلسلیا. 

e‏ يبدأ العنصر بقوسین مین < الوسم > وينتهي بقوسین مثلثين» تتوسطها شر طة 
مائلة <الوسم | >. 


وياد 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الفصل الخامس 
توظیف البنك الشجري في بناء النماذج النحوية 


وتحقیقّا للغرض من البناء قامت الدراسة ببناء نموذج نحوي للفثات النحوية 
الوظيفية» یعتمد على آسالیب التعلم الاحصائي في التعرف على الخصائص التركيبية 
والنحوية بصورة نمطية في المدونة اللغوية الموصفة قيد الدراسة» وذلك من خلال 
تدريب خوارزمية التصنيف Classification‏ ذات نمط التعلم الموجه Supervised‏ 
Learning‏ على التوصيفات اللغوية (الیدوية) التي تعمل على استقراء معطياتها من 
هذه التوصيفات. 


۱- منهجية بناء نموذج نحوي للغة العربية الفصحى المعاصرة 

قبل البدء في تقديم منهجية بناء النموذج النحوي النشود. ينبغي أن نقف على 
مفهوم نمذجة اللغة (à Language Model‏ إطار تقنيات الذكاء الاصطناعي ووسائله. 
فالنمذجة هي الصياغة الصورية للمعرفة اللغوية من خلال استقراء العينة القصدية 
الفى تمثل الواقع اللغوي ومن ثم کانت النمذجة النحوية هي صورنة درجة الارتباط 
والتلازم بين القولات اللغوية الختلفة في الدونة اللغوية الوصفة. 

وتتمحور الخطوات النهجية لبناء نموذج نحوي للغة العربية العاصرة فيا يلي: 


=y ۳ 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


۱-۱ بناء نموذج تركيبي للغة العربية العاصرة 

U‏ كانت العلاقات التركيبية مدخلا أساسيًا لتمثیل الربط والارتباط بين آجزاء 
الجملة» ودلیلا هاديًا في تحدید الفتات النحوية الوظيفية» فکانت جديرة Ol‏ تکون 
مصدرا أساسياء تستمد منه تقنیات التعلم الآلي الوجه معطیاتها؛ للاستدلال على 
الفئات التصنيفية Classes‏ الوسومة في مدونة البنك الشجري النحوي. 

وآفضی ذلك إلى بناء نموذج تركيبي Syntax Model‏ للغة العربية الفصحی 
العاصرة لاسی| لغة الصحافة الصرية الإلكترونية» وذلك؛ نظرا لطبيعة الدونة اللغوية 
التي یستند الیها مدونة البنك الشجري النحوي» وهذا لا يعني أن هذا النموذج لا 
یصلح للتطبیق على العربية كلهاء وإن كان سيعطي نتيجة آفضل على لغة الصحافة. 

وتقوم منهجية بناء نموذج تركيبي إحصائي على ثلاثة إجراءات رئيسية: 


۱-۱-۱ المدونة اللغوية 

يتطلب بناء النموذج التركيبي في إطار تقنية التعلم الآلي - آول ما يتمثل به - تعيين 
مدونة للتدريب خالية من الأخطاء الفنية LOU‏ تستمد مصادرها من البنك الشجري 
النحوي للغة العربية المعاصرة موضوع الدراسة؛ لذا توجب على الدراسة أن تقسم 
الدونة اللغوية الموصفة عينة الدراسة إلى مدوتتين» مدونة للتدریب غلل الالیة» وأخرى 
لاختبار هذه الآلية بعد التدريب. 

والتزامًا بالشائع في المجتمع المعلوماتي» فقد خصصت الدراسة حوالي 80% من حجم 
البنك الشجري أي ما يعادل 4,417 ila‏ للتدريب عن طريق الاختيار العشوائي» و 20% 
للاختبار أي ما يعادل 4 جلة باستخدام خوارزمية 16-1014 التي يتم بمقتضاها 
تقيسم الدونة اللغوية بين التدريب والاختبار في عددٍ من الصور المختلفة؛ حتى يمكن 
تكرار التجربة أكثر من مرة وفقا لعدد صور مدونتي التدريب والاختباره حیث>1 تعني 
عدد صور التقسيم التي تتراوح غالبا ما بين العدد عشرة ٠١‏ أو العدد خمسة ۵. 

ولا كان حجم البنك الشجري النحوي ليس ضخًاء فقد اقترحت الدراسة العدد K‏ 
خمسة؛ أي أن تقسّم المدونة اللغوية أو البنك الشجري إلى مدونتين (التدريب والاختبار) 
في مس صور مختلفة. 


ك 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


۲-۱-۱ خوارزمية التدريب 


لما كان تطبيق خوارزميات التحليل التركيبى يتطلب الاعتماد على منصة أو بيئة حاسوبية» 
فقد اقترحت الدراسة الاعت‌اد على منصة sla‏ البرمجية؛ لما تتوافر فيها العديد من 
الخيارات التي تسمح بتفعیل آکثر من خوارزمية في وقت واحد» ومن هذه اخوارزمیات: 

(PCFG) Probabilistic Context Free Grammar خوارزمية‎ - 

هي إحدى الخوارزميات الستخدمة في التحلیل التركيبي الآلي» تقوم فکرتها على 
تحلیل الجملة الدخلة عن طریق بناء الشجرة التحليلية من الأعلى أي جذر الشجرة 
(وهو الرمز 5) للأسفل أي الکلیات. وذلك في إطار تطبیق القوانین الا حتالية الشر il‏ 
على قوانین بنية العبارة التي تم استخلاصها من مدونة التدریب.۲ 

ثمة مشکلات قد تطرأ على تطبیق هذه الخوارزمية خاصة على اللغة العربية» منها: 

١‏ - مشكلة التكرار من ناحية اليسار التى قد تحدث أثناء تطبيق قوانين العقد اللانهائية 
à‏ أعلى الشجرة؛ ما تؤدي إلى حلقات كران غير نبائية «Infinite loops‏ ومن ثم 
فشلها في تحلیل آجزاء في القوانین. مثال ذلك قانون: VP VP PP PP‏ حیث نجد 
تكرارًا للقانون من ناحية الیسار» ووفقا لطريقة البحث التي تتبعها الخوارزمية بتحلیل 
e‏ الایسر أولاء نجد آنها تدخل فى حلقة تكرارية غير نهائية من تولید الأشجار. 

-Y‏ مشكلة الغموض أي عدم قدرة الخوارزمية على التعامل مع الجمل الخامضة 
التى تحتمل تحليلين أو أكثر. مثال ذلك جملة ” ریت ولذا بنظارات؟ التى تحتمل معنيين 
TAY‏ السیاق النحوي. l‏ 

CYK Cocke-Younger-Kasami خوارزمية‎ - 

وتفاديًا للمشکلات التي ظهرت في التحلیل من الأعلى إلى الأسفل Top-down‏ 
8 قدم کل من الأمريكي جون كوك John Cocke‏ ودانیال ينجر Daniel‏ 
۲ والياباني تاداو کاسامی Tadao Kasami‏ فكرة جديدة تنطلق في التحليل 
التركيبى من الأسفل أي الكلرات ال الأعلى Bottom-up parsing‏ آي جذر الشجرة 
مع مراعاة الاعتمادیات بن کلیات الشجرة فى الل 


(1) Jurafsky.D & Martin.J. (2007). ۰ 
(2) Jurafsky.D & Martin.J. (2007). Ibid.P.486. 


و 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


وتتجه هذه الخوارزمية - آولا - إلى تعيين قوانين العقد النهائية لدونة التدریب؛ 
ثم تتوسع في إيجاد كل العقد غير النهائية الممكنة لتغطية الستوی الثاني» ثم حساب 
احتمالات أفضل عقدة مناسبة للعقد النهائية» ثم تتوالى هذه العملية في كل المستويات 
إلى أن تصل إلى جذر الشجرة S‏ 

وقد اعتمدت الدراسة على خوارزمية CYK‏ - باعتبارها آفضل خوارزمیات 
التحلیل التركيبي التاحة - في ضوء منصة ستانفورد التي تستخلص القوانین من مدونة 
التدریب في صيغة تشومسکي العادية Chomsky normal form (CNF)‏ التي تنظم 
كل القوانين في جانبين'''» بحيث يكون لديا قابلية التعامل مع الخوارزمية. 

وبعد التدريب وإقامة النموذج التركيبي الاحصاتي» يمكننا الآن تجريبه أي النموذج 
- من حيث التفعيل - من خلال إدخال جملة " تتواصل الحرب التي يشنها النظام 
السوري وحلفاء ه ضد أبناء سوريا“”" عبر واجهة الرسوم GUI‏ ومن ثم تحليلها 
باستخدام النموذج التركيبي الاحصائي» کا يظهر بالشكل رقم 59. 


File Language 
ieadfile | LoadParser | Save Output 


Parse Clear. 


تتواصل الحرب النى بشن ها النظام السورى و حلفاء o‏ صد أبناء سورب 


Parser: fhomelahmedistanford-parser-ull-2013.06:20 importantForNewmodelistanford-parserjarabiSATB.ser.gz 
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الشکل:4۹ تحلیل جملة“ تتواصل الحرب...“ عن طریق النموذج التركيبي الاحصائي 
ولعدم وضوح الروية كاملة للهيئة الشجرية للجملة الحللة فى النصة احاسوبیق 
(Y)‏ الجانب الأيسر هو المركب» والجانب الأيمن هو الکون من مرکبین أو كلمة. 
(Y)‏ بالطبع ستتم التجزئة GT‏ حال إدخال الستخدم للنص الراد تحلیله 5 ÉS‏ أي بالامکان إدماج آداة التجزئة بمنصة 


التحليل التركيبي. 


دع ع ات 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


یمکننا أن نعرضها من خلال التمثيل البديل (الأقواس). 
"تتواصل الحرب التي يشنها النظام السوري وحلفائه ضد أبناء سوريا.“ إسلام 
آون Y‏ 115 


(VP (PresenttActive-*sVerb-tNullSuffix (تتو اصل‎ 
(NP 
(NP (Definit*Noun*NullSuffix (الحرب‎ 
(SBAR 
(WHNP (DefinittNoun*RelPro*FemintSingle (التي‎ 
(S 
(VP (Present*Active-*Verb-4*NullSuffix jy) 
(NP (NullPrefix*Noun-*Pronoun-cNullSuffix La) 
(NP 
(NP (Definit-*NountNullSuffix (النظام‎ (Definit+Noun+tRelAdj 
((السوري‎ 
(NullPrefixtConj-*NullSuffix (و‎ 
(NP (NullPrefixtNoun-c*NoSARF-*Plural-*NullSuffix (حلفاء‎ 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix ((((((((ه‎ 
(NP (NullPrefixtNoun-*NullSuffix b) 
(NP (NullPrefix*tNoun-Plural-4NullSuffix (أبناء‎ 
(NP (NullPrefix*Noun*NoSARF-FemincSingle (((((سوریا‎ 
(PUNC .))) 


۳-۱-۱ التقييم 

نستطیع آن نقیم دقة الالية أو النموذج الا حصائي من خلال مدونة الاختبار 
باعتبارها معيارًا Gold Standard (as‏ مشايبًا لدونة التدریب» ولیست مطابقة 
ها. وقد استعانت الدراسة بأداة تقييم التحلیل المكوني ۲۲۵۷۵10 للباحث 
الاسکتلندي فدریکو سنجاتي Federico Sangati‏ بجامعة أدنبرة «Edinburgh‏ 
فکانت النتائج كما يلي: 


CO‏ يمكن تحمیل الأداة من خلال هذا الرابط: 
evalC. (2010). http://homepages.1inf.ed.ac.uk/fsangati/‏ 


=y $o- 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


تقييم التحلیل الكوناتي Constituency parsing‏ 


الدقة المراجعة المتوسط التوافقى 
F-measure Recall Precision‏ 
آقل أو یساوی 70 
كلمة. 


%81.29 81.21% %81.37 


YU gal‏ تقييم النموذج التركيبي الإحصائي على مستوى الوحدات 

وقطعا تختلف النتائج للأفضل عندما يكون المدخل معنونًا بالأقسام الكلامية 
باستخدام المعنون الآلي» إذ كلما كانت دقة توصيفات الأقسام الكلامية عالية» كانت 
Use‏ للخوارزمية على دقة تحديد العقد Nodes‏ المناسبة. 

ولإثبات الافتراض الذي افترضه البحث حول تحسن النتائج بعنونة النص المدخل 
مسبقًا باستخدام آلية عنونة الأقسام الكلامية» فقد تم اختيار جملة عشوائية من الصحافة 
المصرية» وقد yl‏ جدناها à‏ صورتين» تحتوي الاول lee‏ على النص «e‏ وتحتوي 
الأخرى على النص نفسه معنونًا بالأقسام الكلامية. 

كانت نتائج الصورة الأولى بعد تمريرها على النموذج التركيبي الإحصائي كا 
بالشكل رقم ٥۰‏ : 


File Language 
leadFie | Load Parser, | Save Output 
امس لاله‎ 


loli vag‏ ل dl‏ مهرد ب تحطم تن مركزتين تحفطان اسستقراره 


Parser: عسطةاعه0!‎ full-201 106-20 importantForNewmodelstanford-parseriarabiSATB. ser.gz. 


ااا il EE‏ صح یک مسو 
E menée. 1 ۴‏ ۴ 
و ي bh"‏ 
loki lok Kei Ee 3 ۴‏ 
Miele‏ سر وس ماعط وس Med‏ اس aleke‏ مسا ماسقا pd‏ ر لم 
z * 5‏ 


الشكل: ٠ه‏ تحليل جملة ” الوضع JULI‏ للجزاثر..." عن طريق النموذج التركيبي الإحصائي 
أن نعرضها من خلال التمثيل البديل (الأقواس). 


i1 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


" الوضع الحالي للجزائر مهدد بتحطم دعامتين مركزيتين تحفظان استقراره." 


(NP (Definit*NountNullSuffix الوضع‎ ( (DefinittNountRelAdj (الحالي‎ 
(PP (NullPrefixtPrepos-*NullSuffix J) 
(NP (Definitt*Noun*NoSARF-Plural*NullSuffix (((الجزائر‎ 
(VP (Present*Active-*Verb4tNullSuffix 5442) 
(PP (NullPrefix*Prepos-*tNullSuffix (ب‎ 

(NP (NullPrefix-Noun*Femin*Plural (تخطم‎ (NullPrefixtNoun*tRelAdj 
+Femin+Single (دعامتین‎ (NullPrefix*Noun*ObjNounctFemintSingle (مرکزیتین‎ 
(NullPrefix*Noun*SubjNoun-*Femin*Single (تحفظان‎ ( 

(NP (NullPrefix*tNoun-*NounInfinit*NullSuffix (استقرار‎ 

(NP (NullPrefixtNoun-*Pronoun-tNullSuffix —a)))) 


(PUNG 3%)‏ 
وتتطلب الصورة الثانية للنص التي تتضمن العنونة بالأقسام الكلامية تنسيقًا معيناء 
كا یظهر في الشکل التالي. 


/DefinitrNounsNullSuffix ,JUxJ!/DefinittNoun*tRelAdj J/‏ الوضع 
/Definit+Noun+tNoSARF+P1‏ الجز انر ullPrefixtPrepos-*NullSuffix‏ 
7ب ral*NullSuffix »445/NullPrefixrNounctSubjNoun-cNullSuffix‏ 
ullPrefixtPrepostNullSuffix ghbxo/NullPrefixtNoun-tNounInfini‏ 
-NullSuffix gaLe»/NullPrefixrNouncFemin-cBinarytNonAdjun‏ 
C-MANSS MAGR (LU. ;$./NullPrefixtNountFemintBinary-t*NonAd‏ 
unct-MANSS MAGR gj Lb /PresenttPassive*Verbt*MARF-tSubjP‏ 

/NullPrefix*NouncNounInfinit*NullSuffix .a»/NullPr‏ استقر ار 
fix*tNountPronoun*tNullSuffix ./PUNC‏ 


وکانت نتائج الصورة الثانية بعد تمریرها على النموذج التركيبي الاحصائي كما 
بالشکل التالی: 
"الوضع ال حالي للجزاثر مهدد بتحطم دعامتین مرکزیتین تحفظان استقراره." 
(ROOT‏ 
(S‏ 
(S‏ 
(NP‏ 
(الوضع (NP (Definit-Noun-*NullSuffix‏ 
((الحالي (Definit-Noun-*RelAdj‏ 
(PP (NullPrefix*Prepos-4NullSuffix J)‏ 
(NP (Definit-*Noun-*NoSARF-Plural-*NullSuffix‏ 
((((الچز !23 
(مهدد (NP (NullPrefixrNoun*SubjNoun-*NullSuffix‏ 


(PP (NullPrefix*Prepos-4NullSuffix (ب‎ 
(NP (NullPrefix*Noun-*NounInfinit-*NullSuffix 


0 oc ۳۳ — ru 


(((((تحطم 


(NullPrefixrNoun-Femin-c*Binaryc*NonAdjunct-MA 


دماغ 2 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


NSS (دعامتین‎ (NullPrefix+tNoun+tFemin+Binary+NonAdjunct+MAN 
SS (مرکزیتین‎ 
(S 
(VP (Present+Passive+Verb+MARF+SubjPro (تحفظان‎ 
(NP (NullPrefix+tNoun+tNounInfinit+NullSuffix 


((استقرار 
((((ه (NP (NullPrefix-Noun-*Pronoun-NullSuffix‏ 
(PUNC .)))‏ 


والناظر في الصورتین بعد تمريرهما على النموذج التركيبي الاحصائي» سیجد اختلافا 
واضحا في التحلیل» ففی الصورة الأولى نجد كلمة "مهدد" رأسا للمرکب «deal‏ 
وكذلك کلمة ” تحفظان“ مركبا اسمیا؛ وهذا ناتج عن عدم دقة العنونة بالاقسام 
الكلامية التي يعينها النموذج التركيبي» آما في الصورة الثانية» فنجد أن كلمة ”مهدد“ 
رأسا للم ركب الاسمی وكلمة " تحفظان“ رأسا لمركب فعلى داخل ila‏ صغری» وهذا 
ناتج عن دقة العنونة بالأقسام الكلامية المسبقة. 

تعد دقة العنونة بالأقسام الكلامية دلیلا هاديًا في تحديد الكلمات داخل مكوناتهاء 
ومن ثم انتظام الکونات / المركبات داخل الجملة. 

ويمكننا - أيضا- تقييم النموذج التركيبي الإحصائي بصورة أخرى من خلال 
تمرير نصوص مدونة الاختبار على معنون الأقسام الكلامية (السراج)» ومن ثم إدخال 
النصوص معنونة بالأقسام الكلامية إلى النموذج التركيبي الإحصائي. وباستعانة أداة 
تقييم التحليل المكوني evalC‏ كانت نتائج التقييم كالآتي: 


Constituency parsing التحليل الكوناتي‎ e 


الدقة الراجعة التوسط التوافقی 
أقل أو یساوی 70 F-measure Recall Precision‏ 
کلمة. 83.83% 82.20% 9583.00 


الجدول:۳۷ تقییم النموذج التركيبي الاحصائي على مستوی الوحدات حال إدخال النص معنونًا - 
3i‏ - بالأقسام الكلامية 


~1 EA- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


ويوضح الشكل رقم ۵۱ التخطيط الانسيابي لبناء النموذج التركيبي الإحصائي. 


Training Corpus 
مدونة التدریب‎ 


Machine learning PCFG Extraction 
algorithm استخلاص احتمالات التحو‎ 


المتحرر من السياق خوارزمية التعلم الالی 


Testing © 

5 دده 1 ا‎ Statistical model 

النموذج الاحصاد ud m‏ 
النموذج الاحصائي 


الشکل:6۱ مخطط انسيابي لبناء النموذج التركيبي 
ویلخص التخطیط الانسيابي التالى الخطوات الا جرائية لتنفيذ آلية التحلیل التركيبى 
سواء أكان الدخل نصا فقط أو نضا معنونًا ÚT-‏ - بالأقسام الكلامية. 


Tested Corpus 
المدوتة التي تم‎ 
اختیار ها‎ 


AS النص بالاجزاء‎ 
Text with POS tags 


التجزتة الآلية 


Automated Tokenization 


التحليل التحوي الآلي 


Syntactic Parsing 


التحلیل التحوي dM‏ 


Syntactic Parsing 


DAL] 
مخطط انسيابي لآلية التحليل التركيبي‎ 


الشكل:”ه مخطط انسيابي لالية التحليل الترکیبی 


tds‏ لآ 


هذه الطبعة 

إهداء من المركز 

ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


۲-۱ بناء نموذج نحوي تصنيفي للغة العربية العاصرة 

وسعيًا لتوفبر العطیات اللازمة للتحلیل اللغوي الأعمق للفهم الأتوماتي للنصوص A gll‏ 
فکان الانطلاق من البیانات الوظيفية لوحدات الجمل - بتحلیلها وإدراك علاقتها - خطوة 
أساسية في استشفاف العلومات التي بدورها تعين على عملية الفهم الآلي للغات الطبيعية. 

وتقوم منهجية بناء نموذج نحوي (للفتات النحوية الوظیفیة) إحصائي على ثلاثة 


إجراءات رئیسیه: 


۱-۲-۱ المدونة اللغوية (استخلاص السمات من البنك الشجري النحوي) 

ولا كان الادراك NI‏ للفئات أو التصنيفات Labels‏ في إطار تقنيات الذكاء 
الاصطناعي يتطلب آدلة ciola‏ مثلة في عدد محدودٍ من الخصائص المميزة التي تعين 
المصنف على الاستتناج» فقد اقترحت الدراسة سات الفئة من حيث موقعها في البناء 
الشجري" بالإضافة إلى الأقسام الكلامية التي تنتمي إليها. 

وقد تمثلت السات Features‏ التي اقترحتها الدراسة لاستخلاصها من البناء 
الشجري عا الترتیب ded‏ 

- الاقسام الكلامية. 

- الفئة التركيبية للكلمة من حيث كونها مركبا اسميا أو فعلياء.... 

- وضع الكلمة في البناء الشجري من حيث التسلسل العائلي (الأب - الأخوات). 

- وضع الكلمة في هيكلة السين البارية من حيث الرأس والمكمل. 

ولا كانت خوارزميات التصنيف الآلي تتعامل مع المعطيات أو السیات بصورة 
رياضية» بحيث يمكن حساب علاقة مصفوفات ومتجهات الوثيقة Matrix and‏ 
01 من خلال بناء نموذج جدولة الكلمات Bag of Words‏ للوثيقة» فكان النظام 


(۱) هناك منهج شائع بين العديد من اللغات لاستخلاص السیات من البنية الشجرية» يطلق عليه TOB‏ إلا أنه يقتصر فقط 
على المركبات؛ إذ يحدد نوع كلمة من حيث وقوعها داخل المركب I-insighttoken or phrase‏ أو خروجها عن هذا 
المركب O-outsight token or phrase‏ أو وقوعها في بداية المركب bigen token or phrase-B‏ نظر : 

Attardi, G. & Dell Orletta, F. (2008). Chunking and Dependency Parsing. In Proc of LREC 
Workshop on Partial Parsing: Between Chunking and Deep Parsing. Marrakech, Morocco 


—-Yo«s- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الجدولي لعرض معطيات التدريب هو الأنسب من حيث ملاءمته لطبيعة الخوارزميات 
الرياضية. ويوضح الجدول رقم ۳۸ وضع معطيات التدريب التي اقترحتها الدراسة. 


Parent X-Bar Rep- 
Parent brother . Class 
d POS Phrase father ۲ i resentations zin 
or 1 2 فئة خت الكلمة‎ 
الأقسام‎ Cat | أن الكلمة‎ MEME 
الكلمة‎ | : "e| ق التسلسل‎ MEE T 
في التسلسل | فلة الرکب | الكلامية‎ in في تمثيل السين‎ | .* b ال‎ 
البارية جري الشجري‎ AP 


احدول:۳۸ وضع السیات في بنية جدولية 

ولا اقتضت الحاجة إلى استخلاص هذه العلومات آلیا من التحلیل الشجري» فکان 
جدير بآن يتم الاستخلاص من البناء الشجري الوصف بلغة الترمیز القابلة للامتداد 
XML‏ إذ تتوافق هذه السیات من الناحية الترتيبية - إلى حد ما - مع التنظیم المهيكلي 
للف XML‏ ومن ثم تکون عملية استخلاص السیات آکثر دقة وإحكامًا. 

وقد تم تطوير آداة استخلاص السات Feature Extraction‏ من البناء الشجري - الرمز 
بلغة الترميز القابلة للامتداد - باستخدام لغة امحافا البرمجية» مدعمة العدید من آنظمة التشغیل. 

ولتوضیح عمل آلية استخللاص السیات من البناء» یمکننا عرض مدخلات الآلية 
و غرجانها» فیعرض الشکل التالي مد خلات الالية التمثلة في البنية الشجرية الرمزة بلغة 
الترمیز القابلة للامتداد. 


۰۲۱۲ راجع الفئات الوظيفية ص‎ )١( 


حا 2558 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


<?xml versionz"1.0" encodingz"ISO-8859-1" standalones"no"?» 


«corpus xmlns:xsi-"http;//www.w3.0rg/2001/XMLSchema-instance" 
xsi:noNamespaceSchemaLocation-"., /schema/TigerXML.xsd" 
ide"CRE SATB" > 
*head external-"file:/home/ahmed/TIGERSearchTools/CRF SATB generated header.xml"/» 
<body> 
«s ide"sl" > 
«graph roote"sl 500" > 
«terminals» 
<t ide"sl 1" words"," poss"NullPrefix«ConjsNullSuffix CON" /» 
<t ide"sl 2" word=" Jaj" poss"PresentsActivesVerbéNullSuffix VRB" /» 
<t ide"sl 3" words" Lug" pos-"NullPrefixeNounsFemineSingle SBJ" /< 
<t ide"sl 4" worde"J$" poss"NullPrefix«NounsNullSuffix IDF" /» 
<t ide"sl 5" words": "جز‎ poss"NullPrefixsNounsNullSuffix IDF" /» 
<t ide"sl 6" worde"100* poss"CD OBJ" /< 
«t ide"sl 7" ۷۵۲۹2۲ "جنيه‎ posz"NullPrefixeNounsNullSuffix TMZ" /> 
«t ide"sl 8" word="." poss"PUNC " /» 
X/terminals» 
«nonterminals 
«nt ide"sl 506" cat-"NP" < 
«edge idrefe"sl 5" labels"--" /» 
€/nt» 
«nt ide"sl 505" cate"NP" > 
«edge idref-"sl 4" labels"--" /» 
«edge idref-"s1 506" label-z"--" /> 
</nt> 
<nt id="s1_508" cat="NP" > 
<edge idrefe"sl 7" label="--" /> 
</nt> 
<nt ide"sl 507" cats"NP" > 
«edge idrefs"sl 6" labels"--" /» 
«edge idrefz"sl 508" labelz"--" /» 
«/nt» 
«nt id-"sl 504" cat-"NP" > 
«edge idrefz"sl 505" labelz"--" /» 
«edge idrefe"sl 507" labele"--* /» 
</nt> 
«nt ide"sl 503" cats"NP" > 
<edge idref="s1_3" label="==" /> 


«edge idref-"sl 504" label-"--" /> 
«nt» 
«nt ide"sl 502" catz"VP" > 
«edge idrefz"sl 2" labelz*--" /< 
«edge idrefz"sl 503" labelz"--" /» 
«/nt» 
«nt id-"sl 501" cat-"$" > 
«edge idrefz"sl 1" label="--" /< 
Xedge idrefz"sl 502" labelz"--" /» 
«edge idrefz"sl 8" labelz*--" /» 
«/nt» 
«nt id-"sl 500" cat-"ROOT" > 
«edge idrefz"sl 501" labelz"--" /> 
«/nt» 
«/nonterminals» 
«/graph» 
«fs» 


oY:‏ نموذج لدخل آلية استخلاص السیات 
s — NollPrefixsConjsNullSuffix 5 ٩50 VP 502+. Head CON‏ 
Jai Present«ActivesVerbsNullSuffix VP VP 502 ۳ 503 Head ۵‏ 
iud  NullPrefix+Noun+Femin+Single NP NP 503 ۳ 504 Head [‏ 
 NullPrefix+Noun+NullSuffix NP ۳ 505 NP 506 Head 6‏ کل 
sjo  NullPrefix+Noun+NullSuffix — NP NPG _ HF‏ 
CD NP ۱۳50 ۳ 500 Head OBJ‏ 100 
 NullPrefix+Noun+Nullsuffiz NP NPS wW‏ جنبه 
PNC ٩ $50 ۷۲0 Head MRK‏ . 


امحدول:۳۹ نموذج لخرجات آلية استخلاص السیات 


۳ ۵ ۰ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


وبذلك تتوفر مدونة التدريب Training set‏ التي تخضع لوسائل التعلم الال الموجه 
لاسی| المصنفات الآلية .Classifiers‏ 


۲-۲-۱ خوازمية التدريب (التصنیف) 

ثمة العدید من الصنفات الستخدمة في بناء التصنیفات الآلية» ومنها على سبیل 
المثال لا الحصر: 

- آلات الدعم الموجهة SVMS‏ 

- مصنف ال حقول العشوائية المشروطة CRF‏ 

- مصنف آشجار القرار DT‏ 

والفارق بين هذه الصنفات هو النظام الرياضي الستخدم - داخل التقنية - لحل 
إشكالية التصنیف .Classification‏ وني ضوء ادف النشود اقترحت الدراسة 
استخدام مصنف الحقول العشوائية الشروط ۲ +018۳ " الذي یعتمد على فكرة 
التسلسل Sequence‏ الإحصائي الاحتالي التي يتم بمقتضاها حساب آثر التلازم بين 
الكلات أو السات في الجملة» ومن ثم استخلاص القاییس Weights‏ الحاكمة التي يتم 
من خلاها إدراك الفئات Classes‏ ,© 

كا یمتاز هذا الصنف بخاصية إضافية عن الصنفات الأخرى. وهي القالب 
16 الذي يمكن من خلاله تعيين سات إضافية في مصفوفة السات عن طریق 
استخدام (الماكرو) التمثل في هذا النمط x [row,col]‏ % آي تعيين سیات السات من 
خلال فكرة التجاور بين الكلمات أو سماتها في الصفوف والأعمدة. 


(۱) تتشابه هذه الحقول العشوائية المشروطة مع نموذج ماركوف الخفي HMM‏ إلا أن الأخير يعتمد في تنبؤه على 
الحالات غير الملحوظة cunobserved (hidden) states‏ أما الحقول العشوائية المشروطة فتعتمد على البيانات 
اللحوظة observed Data‏ أي المصفوفة الممثلة في هيئة أعمدة وصفوف. انظر: 
Ponomareva N, Rosso P, Pla 1, Molina A. (2007). Conditional random fields vs.‏ 
hidden markov models in a biomedical named entity recognition task. In Proc. of Int.‏ 
.Conf. Recent Advances in Natural Language Processing, RANLP‏ 
(Y)‏ یمکن تحمیل الأداة من خلال هذا الرابط: 
/CRF++. (2003). https://taku910.github.io/crfpp‏ 

(3) Sutton, Ch. & McCallum, A. (2010). An Introduction to Conditional Random Fields. 

Cornell University Library.P.2. 
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هذه الطبعة 

إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


وتتضح الفكرة من خلال عرض القالب الدرج في مصنف الحقول العشوائية 
الشروطة الذي اعتمدته الدراسة ف تعن سیات الکلمات الرتبطة سياه O‏ 


# Unigram 
U00:96x[-2,0] 
U01:%x[-1,0] 
U02:%x[0,0] 
U03:%x[1,0] 
U04:%x[2,0] 
U05:%x[-1,0]/%x[0,0] 
U06:%x[0,0]/%x[1,0] 


U10:%x[-2,1] 
U11:96x[-1,1] 

U12:%x[0,1] 

U13:%x[1,1] 

U14:%x[2,1] 
U15:%x[-2,1]/%x[-1,1] 
U16:%x[-1,1]/%x[0,1] 
U17:%x[0,11/%x[1,1] 
U18:%x[1,1]/%x[2,1] 
U20:%x[-2,1]1/%x[-1,11/%x[0,1] 
U21:%x[-1,1]1/%x[0,11/%x[1,1] 
U22:%x[0,11/%x[1,11/%x[2,1] 


# Bigram 
B 


CO‏ مع العلم یمکن تغيير وضع السات في القالب على الستویین ( الصف. العمود). 


-ع۲۵- 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


يلاحظ أن القالب يتدرج في تعيين السمات» حيث نجده في المجموعة الأولى يتمحور 
حول سات الکلمة من حیث ما یسبقها آو یتلوها؛ |3 یشغل الصف - وفقا bali‏ 
- الأعداد الوجبة التي تنم عن علاقة الکلمة [o‏ بعدهاء و الأعدد السالبة التي تنم 
عن علاقة الكلمة بیا قبلهاء GT‏ العمود فیلزم الحالة الصفرية هناء ثم تتدرج هذه ا حالة 
بالتوسع في الجموعة التالية؛ لتشمل الصف والعمود معّ وهکذا... 


وبعد التدریب وإقامة نموذج الصنف الآلي» یمکننا جریبه من خلال إدخال جملة ” 
تتواصل الحرب التي يشنها النظام السوري وحلفاء ه ضد آبناء سوريا“ الحللة تركيبيًا 
عن طريق النموذج التركيبي الاحصائي: 


(VP (PresenttActive-*Verb-*NullSuffix (تتواصل‎ 
(NP 
(NP (DefinitcNoun*NullSuffix pja!) 
(SBAR 
(WHNP (DefinittNoun*RelPro-*Femin*Single (التي‎ 
(S 
(VP (Present*Active-*Verb-4NullSuffix jy) 
(NP (NullPrefixtNoun-*Pronoun-tNullSuffix La) 
(NP 
(NP (Definit-*NountNullSuffix (النظام‎ (Definit-*Noun-*RelAdj 
((السوري‎ 
(NullPrefixtConj-4*NullSuffix (و‎ 
(NP (NullPrefix+tNoun+tNoSARF+Plural+NullSuffix (حلفاء‎ 
(NP (NullPrefixtNoun-*Pronoun-*NullSuffix ((((((((ه‎ 
(NP (NullPrefixtNoun-*NullSuffix b) 
(NP (NullPrefix*Noun-*Plural-4NullSuffix (أبناء‎ 
(NP (NullPrefix*Noun*NoSARF-FemincSingle L5555))))) 


(PUNC: .2)) 


=f 00= 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


فكانت النتائج كما c b‏ مشتملة على الوحدات (بنظام النقل الكتابي باكولتر) O‏ 


1 ttwiSl  Present+ActivełVerbłNullSuffix VP ۷۶:0 HP 50348P 514 Head VRB 
2 Alirb DefinitsNounNullSuffix — NP 1۳50 SB 

3 Alty — DefinitsNountRelProsfeminsSingle — WENP — WENPS06 _ — QN 

4 yn PresentiàctivesVerbsNullSuffix VP VP 508 HP 509:NP 510 Head VRB 

S hA  NullPrefiz+Noun+Pronoun+NullSuffix NP ۱۳۹0 ۵ 

6 AlnZàm  Definit+NouniNullSuffix NP — NP 51] — Alsy  _ SB 

I Alswry  Definit+NountRelAdj — NP ۱۳ 511 — Anm — HOD 


8 w  NullPrefix:ConjsNullSuffiy NP HP 810 HP 511408 512 Head — CON 

9 HlfA'  MNullPrefiz+NountNoSARF+Plural+NullSuffiz NP هلا‎ 512 ۳ 513 Head — NN 
10 h RullPrefix+NountPronountlullSuffixu ظ۱‎ — NP513 IDF 

11 Dd NullPrefirsNoun:NullSuffix ۱۳ ۳ 114 ۳ 515 Head MD 

12 »bnÀ' NullPrefirsNoun:PluraliNullSuffixy NP HP 515 — NP 516 Head IDF 

13 swryA — NullPrefirsNounsNoSARPWFemintSinge — NP ۳6 _ —— IDF 

M. PMC S S50 ۷۶50 Head MK 


الجدول: ۰ 4 نموذج لخرجات آلية التصنیف الآلي لجملة “ تتواصل الحرب...“ 
وبتحدید JI‏ حدات والفئات الوظيفية دون السات: 


= 
z 
= 


8 


3 
4 
5 
6 


الجدول:١5‏ تحديد الفئات النحوية الوظيفية دون السمات في مخرجا 
تتواصل الحرب...“ 


)١(‏ قد واجهت مشكلة في استخدام الحروف العربية في أداة eCRF++‏ لذا آدجت في الأداة حول النقل الكتابي باكولتر 
لتحويل النص الدخل إلى نظام باكولتر» ومن ثم يكون ا مخرج بنظام هذا النقل الكتابي» ومع ذلك يمكن تحويل هذا النظام 
ثانيا إلى الحروف العربية. 


O 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


۳-۲-۱ التقييم 


وبعد تدريب مصنف الحقول العشوائية على ا معطيات اللغوية التي تم استخلاصها 
من البنية الشجريق وإقامة النموذج النحوي الإحصائيء یمکننا أن نقيّم هذا النموذج 
من خلال مدونة الاختبار» بحساب معدل الخطأ للفئة Class error Rate (CER)‏ 
الذي يتم في إطار المقارنة بين التحليل الآلي ومدونة الاختبار (المعيار الذهبي). 


10,4% 1,104 4,417 5,521 117,785 | 105,781 


احدول: 4۲ |حصائیات النموذج التصنيفي وتقييمه 
ویوضح الشکل رقم ۵6 التخطیط الانسيابي لبناء نموذج الصنف الالي للفتات 
الو b‏ ۰ و 


- ee 


Features*Labels Feature Extraction 
مستخلص السات السیات والفتات‎ 


Tested Corpus 
الدونة التي تم اختبارها‎ 


الشکل :£ o‏ مخطط انسيابي لبناء النموذج التصنيفي 


-۲ ۵۷ 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


وبعد الانتهاء من بناء النموذجین الا حصائیین بصورة منفردة لكل منهماء یمکننا استعراض 
التکامل فيا (Ces‏ - لیتحقق ال هدف النشود - من خلال التخطیط الانسيابي التالي: 


Syntactic Parser output 


خرج الحلل التركيبي 


Buckwalter Transliteration UTF-8 To Buckwalter converter 
ERU إل نظام‎ edi آلية تحويل نظام الخرف‎ 
8 1 یاک لمر‎ 
XML Format 
TIGERRegistry 


8 تنسیق بلغة الترمیز القابلة للامتداد 
أداة e‏ الألمانية 


Feature Extraction 
مستخلص السیات‎ 
Classifier Model 
الصتف‎ c تموذ‎ 
Classified output 
للخرج‎ 


Select Labels 


تحديد الفتات 


Buckwalter Transliteration 


التقل الحجائي 


مخطط انسيابي للتكامل بين التموذجين الإحصائيين 
الشكل oo:‏ خطط انسيابي للتكامل بين النموذجين الإحصائيين 


۳-١‏ التقييم الشامل لتكامل النموذجين الإحصائيين (النموذج النحوي) 
وبتقييم هذه النموذج النحوي المتكامل أي عندما يستند إلى معطيات التحليل 
التركيبي الآلي لاستخلاص السات التي تعينه على التعرف على الفئات الوظيفية كا 
في المخطط السابق» یمکننا الاعتماد على نصوص مدونة الاختبار المعنونة بالأقسام 


۷۵/۸ سب 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الكلامية CIT‏ - التي تم اعتمادها سابقا في تقييم النموذج التركيبي الإحصائي - في تقييم 
النموذج باعتبارها مدخلا للنموذج التركيبي الإحصائي ثم آلية استخلاص السیات ثم 
النموذج التصنيفي. 

وبعد تمرير نصوص مدونة الاختبار على الخطوات الإجرائية لمنهجية بناء النموذج 
النحوي للغة العربية المعاصرة؛ ثم مقارنة نتائجها بمدونة الاختبار (المعيار الذهبي)» 
كانت النتائج كا يلي: 


عدد الجمل دقة النموذج الترکیبی معدل اطاً للفئة 


إحصائيات 1,104 83,00 12,3 


احدول:۳؟ تقييم النموذج النحوي المتكامل 


- 5094 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الخاتمة والنتائج 


الخاتمة 

حاول هذا الکتاب أن يقدم الا طار المنهجي لبناء البنك الشجري النحوي من خلال 
التطبيق على نصوص من اللغة العربية المعاصرة» ثم موظفًا إياه في بناء نموذج نحوي 
إحصائي باستخدام تقنيات التعلم الآلي ( خوارزمية التصنيف). وقد أمكن من خلال 
البناء والتوظيف التوصل إلى عدد من النتائج» كان من آهمها ما يلي: 

بلغ عدد كلمات المدونة اللغوية 105,781 كلمة - من نصوص موقع إسلام أون 
لاين - بعد إزالة الفواصل والمساحات الفارغة» والكلمات المكتوبة بحروف إنجليزية» 
تضمها 110 وثيقة نصية. 

بلغ عدد الکلمات غير المكررة في المدونة اللغوية 38,321 كلمة. وبالنظر إلى إحصاء 
(الکللات - الكلمات غير المتكررة) في المدونة اللغوية» نجد أن هناك علاقة شبه ثابتة 
بين حجم النص» وعدد المفردات غير المتكررة فيه. وهذا ما يؤكد تنوع الوضوعات في 
لعينة المختارة (المدونة اللغوية) من المجتمع اللغوي غير المحدود. 

تنوعت نصوص الدونة اللغوية في عدد من المجالات (السياسة - الاقتصاد - 
الفنون - الاجتماع - العلوم - الرياضة) بهدف تحقيق قدر كاف من أناط التركيب 
الجملي في الاستعمال» والمفردات والأساليب المختلفة. 


=y t= 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


آمکن تهيثة الدونة اللغوية للمعالجة UST‏ بحيث یکون لديا قابلية للتعامل مع 
الأساليب البرمجية للمعالجة الآلية للغة الطبيعية وقد آفاد منها البااحث في التحلیل QI‏ 
عبر تقنيات اللغة» وكذلك في بناء النماذج الإحصائية. 

أمكن إخضاع النصوص لعملية التجزئة؛ لتمكينها من التحليل الآلي» والعنونة 
اللغوية» فبلغ عدد جمل المدونة اللغوية بعد التجزئة 5521 dle‏ وعدد الوحدات 
Tokens 117,785‏ وحدة. 

آمکن عنونة نصوص الدونة اللغوية بالاقسام الکلامية؛ لتکون مدخلا أساسيًا 
لتعیین العلاقات التركيبية في| بعد. 

آمکن عنونة نصوص الدونة اللغوية بالعلاقات التركيبية والفئات الوظيفية؛ لیکتمل 
البناء الشجريء ویکون مورا لغویّا لتطبیقات معاحة اللغة العربیف وأداة للبحث في 
الظواهر اللغوية. 

إن أية عملية تحلیل نحوي تتوخی الطرق المنهجية في الوصف النحوي, لابد أن تتوفر 
لديا ثلاثة قيود أساسية ( التمثیل النحوي - الحتوی النحوي - النظرية النحویة). 

آمکن اختبار دقة البناء الشجري - من خلال القیاس الاحصائي لتعیین درجة 
الصداقية أو التوافق بين تحلیللات العينة المختلفة inter-rater agreement‏ - باختيار 
عينة عشوائية ۱۰۰ جملة قد تم تحلیها من قبل» ثم إعادة تحلیلها مرة آخری من قبل 
لغوي آخر قد تدرب على منهجية التحلیل» بحیث یتحقق ركنا العادلة لقیاس نسبة 
التوافق. وقد آمکن مقارنتها باستخدام أداة cevalC‏ فبلغت نسبة التوافق بين التحلیلین 
0 وکان جل الاختلاف الوارد في العینتین في مواضع تعيين عناصر البناء الشجري 
للبدل والصفة والاضافة؛ لتقارب البناء ee‏ بینهم. 

آمکن البحث في الظواهر اللغوية لا سيا أناط التركيب الجملي - باستخدام أداة 
5 - التي تم توصیفها في إطار مدونة لغوية تعكس الواقع اللغوي» مع معرفة 
ترددات تلك الظواهر أو الأناط؛ وذلك للافادة منها في تعلیم اللغة العربية للناطقين 
مها أو بغرها. 


)١(‏ يمكن تحميل هذه الأداة من خلال هذا الرابط: 
Tregex. (2005). http://nlp.stanford.edu/software/tregex.shtml‏ 


due 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


أمكن ترميز البنك الشجري بلغة الترميز القابلة للامتداد XML‏ لسهولة استدعاء 
العلومات اللغوية أو دمجها في التقنيات البرمجية. 

بناء نموذج تركيبي للغة العربية المعاصرة» باستخدام تقنيات التعلم الآلي (خوارزمية 
(CYK‏ وقد بلغت دقة نتائجه 81,2996 حال إذا كان الدخل نصا Raw Text Gle‏ أما 
إذا كان المدخل نصا معنونًا GT-‏ - بالأقسام الكلاميةء فقد بلغت دقة نتائجه 83,00%. 

تبيّن البحث كلما ازدادت دقة توصيفات الأقسام الكلامية للنص المراد تحليله 
تركيبياء ازدادت دقة خوارزمية التحليل التركيبى على تحديد العقد Nodes‏ المناسبة 
لأجواء Aldd‏ ۱ 

بناء نموذج نحوي وظيفي للغة العربية العاصرة - باستخدام آلية التصنیف 
(CRF++Classifier)‏ - یقوم على الفهو e‏ النحوي Syntactic Concept‏ في تصنیف 
الفئات النحوية؛ وذلك للافادة منه في تطبیقات السوال والجواب» وغيرها من 
التطبیقات التي تقوم علي الفهم الاتوماي للنصوص اللغوية. وقد بلغ معدل الخطأ في 
نتائجه أثناء اختباره 10,4%. 


عو 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


المراجع 


المراجع 

SI‏ المراجع العربية: 

ه ابن جني (أبو الفتح عثان): اللمع في العربية» تحقيق الدكتور سميح آبو مغلي» دار 
مجدلاوي للنشر عمان» g Y AAA‏ 

cule‏ خلدون ( ولي الدين عبد الرهن بن حمد): مقدمة ابن خلدون, تحقيق عبد الله 
محمد الدرويش. دار البلخي - دمشق» ط ۰۱ الجزء الثاني» ٠١٠٠١ ٤‏ م. 

ه الأنصاري (ابن هشام): مغني اللبيب عن كتب الأعاريب» تحقيق محمد qe‏ 
الدين عبد الحميد» المكتبة العصرية - بيروت» p AA‏ 

ه أنيس (إبراهيم): من أسرار اللغة» مكتبة الأنجلو المصرية» 1 1917/8 م. 

«برينكر (کلاوس): التحليل اللغوي للنصء مدخل إلى المفاهيم الأساسية والمناهج» 
ترجمة: أ.د سعيد حسن البحيري» مؤسسة الختار للنشر والتوزيع» ۲۰۱۰م. 

ه بحيري(سعيد حسن): نظرية التبعية في التحليل النحوي.مكتبة الأنجلو ci pall‏ 
ط۱ ۱۹۸۸م. 


اع ۷ب 


هذه الطبعة 
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ه البهنساوي (حسام): القواعد التحويلية في دیوان حاتم الطائي مكتبة الثقافة 
الدينية» القاهرة » ۱۹۹۲م. 

ه البنهساوي (حسام): نظرية النحو الكلي والتراكيب اللغوية العربية» مكتبة الثقافة 
الدينية» 5 ۲۰۰م. 

ه بونيه (الان): الذكاء الاصطناعي واقعه ومستقبله» ترجمة د.علي صبري (dé P‏ 


عالم العرفت ٠۹۹٩۲‏ م. 
« بوول (جيفري): النظرية النحوية» ترجمة د.مرتضى باقر المنظمة العربية للترهت 
REN‏ 


ه الجرجاني (عبد القاهر): دلائل Oboe YI‏ تحقيق أبي فهر حمود محمد شاكر» مكتبة 
الخانجي - القاهرق ط ۰۱ AA‏ م. 

o‏ الجرجاني (عبد القاهر): کتاب القتصد في شرح الایضاح. تحقیق د. کاظم بحر 
المرجان» دار الرشید للنشر - الجمهورية العراقية ۱۹۸۲م. 

e‏ حسان (تمام): مناهج البحث في اللغة مكتبة الانجلو القاهرق ط ۱ ۱۹۵۵م. 

ه حسان (مام): مناهج البحث اللغوي» مكتبة الأنجلو الصريق e VA‏ 

p YA E حسان (تمام): اللغة العربية معناها ومبناهاء دار الثقافة»‎ e 

e‏ حميدة (مصطفی): نظام الارتباط والربط في تركيب الجملة العربية» مكتبة لبنان- 
ناشرون» ۱۹۹۷ م. 

ه خضر( محمد ذكي): الحروف العربية واحاسوب. مجلة مجمع اللغة الأردني-عمان» 
ILLE‏ 

e‏ خلیل (شرف الدین): الاحصاء الوصفی. شبكة الأبحاث والدراسات 
الاقتصادية» د.ت. l‏ 

e‏ خلیل (حلمی): الكلمة دراسة لغوية معجمية دار العرفة الجامعية» الأسكندرية» 
g AAA‏ ۱ 

e‏ الدحداح (آنطوان): معجم لغة النحو العربي» مکتبة OU‏ ناشرون ۲۰۰۰م. 

« دعبول (موفق) کیوان (فایز) البواب (مروان)» وآخرون: معجم مصطلحات 
العلوماتية (عربي - انجليزي) الجمعية العلمية السورية العلوماتیة دمشق» «Me‏ 
۱م 
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ه الراجحي (عبده): النحو العربي والدرس الحديث ”بحث في النهج" دار النهضة 

۰ زفارت (جوست): الشات التركيبية والبنيات JYI‏ علاقة الشكل بالمعنى. 
ترجمة د.عبد الواحد خبري» ط ١‏ »دار الحوار للنشر والتوزيع» سورياء evt ٠۸‏ 

e‏ زكرياء (میشال): الالسنية التوليدية وقواعد اللخة العربية (النظرية الالسئیة)» 
ط ۲ المؤسسة الجامعية للدراسات والنشر والتوزیع» ۱۹۸م. 

e‏ الساقي (مصطفی): آقسام الکلام العربي من حيث الشکل والوظيفة» مكتبة 
الخانجي بالقاهرة» ۷م 
أطروحة دکتوراه » دار العلوم جامعة القاهرق ١٠١5م.‏ 

ه السيوطي (الإمام جلال الدين): همع ال هوامع في شرح جع الجوامع. تحقيق د.عبد 
JUI‏ سالم مکرم مؤسسة الرسال ۱۹۹۲م. 

ه سيبويه ( أبو بشر عمرو بن عثمان بن قنبر): الكتاب (كتاب سيبويه)» تحقيق عبد 
السلام محمد هارون» مکتبة الخانجي بالقاهرة ۸ م. 

هشریف (عمرو): ثم صار ا مخ عقلاء طبعة مكتبة الشروق الدولیق ط ۰۲ ۲۰۱۳م. 

ه شمس الدین(جلال): SI‏ الشكلية لکلام العرب. نظرية وتطبیقا دراسة 
بنيوية» مؤسسة الثقافة الجامعية» الأسکندریق ۰۱ ۱۹۹۵م. 
الاداب بمنوبة» .۸۱۹۹٩۱‏ 

e‏ عبادة (محمد إبراهيم): الجملة العربية» مكوناتها- أنواعها- تحليلهاء مکتبة الا داب 
القاهرق ط 6 ۲۰۰۷م. 

ه عبد العزیز ( محمد حسن):لغة الصحافة العاصرق دار العارف» واه 

e‏ عفيفي del)‏ مصطفی):النظرية النحویة-الفاهيم والتحدیات وقائع 
مور العربية وقرن من الدرس النحوي*؟ دار العلوم-القاهرة" ۰۳ ert‏ 

«de ©‏ (نبیل)» حجازي» (نادية): الفجوة الرقمية ie i5,‏ لجتمع ارف 
عالم العرفت ۲۰۰۵م. 

e ۸ على (نبيل):اللغة العربية واحاسوب. تعریب»‎ e 


= 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


e‏ غالیم (محمد): هندسة التوازي النحوي وبنية الذهن العرفية. کتاب آفاق 
اللسانیات (تکری| للأستاذ الدکتور اد الوسی). مركز دراسات الوحدة العربیق 
بیروت ط ۲۰۱۱۱۰۱م. 

ه الفهري (عبد القادر الفامی): البناء الموازي» نظرية في بناء الكلمة وبناء الجملة» 
دار توبقال للناشره الغرب» ط ۰۱ ۱۹۹۰م. 

o‏ ابن منظور (محمد بن مکرم بن علي آبو الفضل جال الدین): لسان العرب» طبعة 
القاهرة» دار المعارف» TARTS‏ 

ه مزوني (دومينيك): قيود النحو الكلي: كيف يكتسب البشر القدرة على الکلام» 
ترجمة فرحات المليح. مجلة الحياة الثقافية. السنة ۲۷. العدد ۰۱۳۹ 7١٠٠7م.‏ 

٠‏ مصلوح (سعد): الأسلوب دراسة لغوية إحصائية» عالم الکتب» ط ۳ 1995م. 

iaa العريية نحو توصیف جدید في ضوء اللسانیات‎ toli) الوسی‎ e 
الوسسة العربية للدراسات والنشر ط ۰۱ ۲۰۰۰م.‎ 

٠‏ نواف (خالد حازم)؛ محمد (إبراهيم حمد): الصحافة الإلكترونية» ماهیتها 
والسوولية التقصيرية الناشئة عن نشاطهاء مجلة الشريعة والقانون العدد السادس 
والأربعين» ۲۰۱۱م. 
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-المعايير الأساسية لعنونة المدونات اللغوية 


الفصل الأول: بناء المدونة اللغوية 


ند 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقياً 
أو تداولها تجارياً 


العنوان 


- المدوّنة اللغوية» واستخدامهاء ومجالات الافادة منها 

- |رهاصات الافادة من الدوّنات AC‏ في الدراسات النحوية 
- تحدید مادة الدونة اللغوية عينة الدراسة 

- التحلیل الاحصائي لادّة الدوّنة اللغوية 

- التهيتة YI‏ للمدونة اللغوية -عينة الدراسة- قبل إجرائها 
تجزئة التصوص 

-مفهوم تجزئة النصوص 

- مستويات تجزئة النصوص في المدونة اللّغوية 

- التوحيد الهجائي 

- نماذج لتجزئة الوحدات اللغوية في المدونة اللغوية عينة الدراسة 
- التحلیل الاحصائي لوحدات à x ES‏ 

الفصل الثاني: العنونة بالأقسام الكلامية 

تقسیم الکلام وأهميته 

- ما الحاجة لتقسیم الکلام؟ 

العنونة بالأقسام الكلامية 


- فئة خوجة الكلامية 


Av 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


العنوان 
- فئة باكولتر الكلامية 
-فئة بييز الكلامية 


-فئة بادت الكلامية 


-الفئة الكلامية القلصة الموسعة 
-فئة القريني الكلامية 
-فئة كاتب الكلامية 


-فئة كاليك الكلامية 


عنونة المدونة اللغوية - عينة الدراسة - بالأقسام الكلامية 
الفصل الثالث: العنونة بالعلاقات التركيبية 

العلاقات التركيبية 

- ما أهمية التحليل بالعلاقات التركيبية؟ 

العنونة بالعلاقات التركيبية 

لماذا العنونة بالعلاقات التركيبية؟ 


الطرق الإجرائية للعنونة بالعلاقات التركيبية 


-51- 


هذه الطبعة 
إهداء من المركز 
ولا يسمح بنشرها ورقياً 
أو تداولها تجارياً 


العنوان 
pem‏ اي 
المحتوى النحوي 
النظرية النحوية 
عنونة المدونة اللغوية - عينة الدراسة - بالعلاقات التركيبية 
فئة العناصر الأساسية للتحليل التركيبي 
فئة السیات النحوية الوظيفية 
الفصل الرابع: ترميز البنك الشجري النحوي 
لغة الترميز القابلة للامتداد XML‏ 
ترميز البنك الشجري النحوي بلغة XML‏ 
الفصل الخامس: توظيف البنك الشجري في بناء النماذج النحوية 
منهجية بناء نموذج نحوي للغة العربية الفصحى المعاصرة 
بناء نموذج تركيبي للغة العربية المعاصرة 
بناء نموذج نحوي تصنيفي للغة العربية المعاصرة 
الخاتمة والنتائج 
المراجع 
المراجع العربية 


المراجع الأجنبية 


AVE‏ ی 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


فهرس الأشكال 


الشكل 
شكل :١‏ شكل تمثيلٍ لتوصيفات الأقسام الكلامية 


شكل ۲: الجتمع اللغوي- المدونة اللغوية (عينة الدراسة) 

شكل ۳: التمثيل البياني لنسب عدد الكلمات الإجمالية والکلیات غير المكررة 
وعدد الوثائق 

شكل 5: الرموز المستخدمة في صيغة التشفير أو الترميز UTF-8‏ 


شكل ۵: تسمية ملفات النصوص 


شكل 1 : خطوات عملية التحليل النحوي 

شكل ۷ تحديد الكلمة النهائية في الجملة- من خلال اخواص- باستخدام 
أشجار القرار 

شکل ۸:آمر تنفيذ أداة التجز ئة العربية Arabic Tokenizer‏ 


شکل ٩‏ :رجات آداة التجز ئة العربية Arabic Tokenizer‏ 


ند 


شکل ۱۰: 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقیا 
أو تداولها تجاریا 


الشکل 


واجهة بایشون لکتابة آسطر كود أداة تجزئة الوحدات الرئيسية 


شکل ۱۱ :رجات آداة تجزئة الوحدات الرئيسية 


شکل ۱۲: 


شکل ۱۳: 
شکل :١5‏ 


ال و حدات الفرعية المکنة للفعل 
الوحدات الفرعية الممكنة للاسم 
طرفية واجهة آسطر الأوامر لینکس" آسطر معالحة أداة 


MADA-*TOKAN 


شکل ۱۵ :رجات برنامج MADA-TOKAN‏ 


شکل ۱١‏ : 
شکل ۱۷: 
شکل ۱۸: 
شکل ۱۹: 
شكل Ys‏ 
شكل ۲۱: 
شكل ۲۲: 
شکل ۲۳: 
شکل ؟ ۲: 
شکل ۲۵: 


خر هی سب نیرسن ddl‏ ااا 

العنونة الكلامية في طبقات سلم معالجحة اللغة الطبيعية 
فئة خوجة الكلامية 

خرجات محلل باكولتر الصرفي 

خرجات محلل c3 s -ElixirFM‏ "لاسکی" 

خرجات محلل Buckwalter‏ -نموذج ”الال ” 


فئة کاتب الكلامية CATIB POS Tag set‏ 
جملة قرآنية معنونة بالاقسام الکلامیة-سورة الانعام آية " 
مثال معنون بفئة سلمة الكلامية 


مخرجات آلية السراج للعنونة الكلامية 


شكل ۲۲: رجات آلية السراج للعنونة الكلامية بعد تطبيق الإجراءات التطبيقية 


m 


۱۳۳ 


۱۳۷ 


شکل ۲۷ 


٤٣ شکل‎ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الشكل 
: خطط هيكلي لبنية الشجرة النحوية 
il:‏ الشجرية الكونية 
: تمثيل العنونة الاعتادية 
a :‏ البنية الشجرية لقال من بذك کولومبیاالشجري 
: نموذج من بنك بنسلفانیا الشجري 
: الخطط التنظيمي لقواعد بنية العبارة 
: مثال على تنظیم الأحكام التركيبية البنية على العنی 
: نموذج بنية الاعت‌ادية «للنص الق رآني» 
:التمفيل الشجري لقانون الحدد 
: التمثیل الشجري لقانون الوصف 
: التمثیل الشجري لقانون الکمل 


: مثال على تنظیم الأحكام التركيبية البنية على العنی في إطار السين البارية 


: نموذج من مدونة ويب للغة الإنجليزية ( في صورة شجرية) 
: نموذج من مدونة ويب للغة الإنجليزية ( في صورة أفقية) 
: آلية ستانفورد للتحليل التركيبي 

: أداة Annotald‏ لتحرير المدونات الموصفة ÉS y‏ 


: ما قبل التحرير 


—YAo-— 


YE 


YA! 


۱۸۳۲ 


۱۸ 


۱۸ 


۱۸۵ 


VAT 


۱۸۹ 


۱۸۹ 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقياً 
أو تداولها تجاریا 


الشکل 
شکل 45: وما بعد التحریر التركيبي 
شکل 6۵ : آداة Annotald‏ أثناء العنونة بالفئات النحوية الو ظيفية 
شکل ET‏ نموذج من تعریفات نوع الوثبقة DTD‏ 
شکل £V‏ : آداة TIGERRegistry‏ الألمانية 
شکل 4۸: نموذج من ترمیز البنك الشجري بلغة الترمیز القابلة للامتداد 


شکل :4٩‏ تحلیل جملة“ تتواصل الحرب...“ عن طریق النموذج التركيبي 
الاحصائي 


شکل ۵۰: تحلیل جملة ” الوضع الحالي للجزائر...“ عن طریق النموذج 
التركيبي الا حصائي 


شکل ۵۱: خطط انسيايي لبناء النموذج التركيبي الإحصائي 
شکل ۵۲: خطط انسيابي لالية التحلیل التركيبي 
شکل ۵۳: نموذج لدخل آلية استخلاص السات 
شکل ٤‏ ۵: مخطط انسيايي لبناء النموذج التصنيفي 


شکل 00: خطط انسيابي للتکامل بين النموذجین الا حصائیین 


EI 


جدول ۱: 
جدول ۲: 
جدول ۳: 
جدول ٤‏ : 
جدول ۵: 
جدول ٦‏ : 
جدول ۷: 
جدول ۸: 


جدول 4: 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


فهرس الجداول 


العنوان 
مجالات المدونة اللغوية» وعدد كلماتها ووثائقها ونسبها المئوية 
أنظمة التمثيل الكتابي المختلفة للأحرف العربية 
معالجة المركب غير الكلامي في نصوص المدونة اللغوية 
معالحة الرمز أو العلامة في نصوص المدونة اللغوية 
المنهجيات المختلفة لتجزئة الزوائد النحوية 
أمثلة على التجزئة من المدونة اللغوية عينة الدراسة 
إحصائيات وحدات المدونة اللغوية 
أقسام الكلام العربي-د.تمام حسان 


عنونة خوجة بالأقسام الكلامية - نموذج من مدونة خوجة 


- ۷۷ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجاریا 


العنوان 


جدول ۱۰: فئة باکولتر الكلامية 

جدول ۱۱: عنونة بنك بنسلفانیا العربي بالأقسام الكلامية 

جدول ۱۲: فئة بييز القلصة الكلامية 

جدول ۱۳ : à‏ بادت الكلامية 

جدول ۱: فئة آر دي آي الكلامية 

جدول ۱۵: نموذج تسمية بعض الورفیمات بالأنواع الكلامية 

جدول ٠١‏ : نموذج معنون بفئة آر دي آي الكلامية 

جدول ۱۷ : مقارنة بين الفئات الكلامية الثلاث 

جدول ۱۸: فئة القريني الكلامية 

جدول ۱۹: فئة کاتب الكلامية - نموذج العنونة بالاقسام الكلامية 

جدول ۲۰: الفئة الکلامية للنص القرآني 

جدول ۲۱: فئة سلمة الكلامية 

جدول ۲۲: الفئة الكلامية بعد اعادة هیکلتها 

جدول ۲۳: عنونة القسم الكلامي « الاسم» في الدونة اللغوية عينة الدراسة 
جدول 5 ۲: عنونة القسم الکلامي « الفعل» في الدونة اللغوية عينة الدراسة 
جدول ۲۵: عنونة القسم الكلامي « الاداة» في الدونة اللغوية عينة الدراسة 
جدول ۲ ۲: عنونة القسم الكلامي « الظرف» في الدونة اللغوية عينة الدراسة 


۷/۲ 


۱۳۸ 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


العنوان 
جدول ۲۷: عنونة القسم الكلامي «كلمة غير عربية» في المدونة اللغوية عينة الدراسة 
جدول ۲۸: عنونة القسم الكلامي ١‏ الترقيم» في المدونة اللغوية عينة الدراسة 
جدول ۲۹: تمثيل هيكلة نيجرا 
جدول ۳۰: من عنونة بنك كرلوسيا الشجري 
جدول ۳۱: فروق بين التمثیل ا مكوني والتمثیل الاعت‌ادي 
جدول ۳۲: التمثیل الاعت‌ادي الحول إليه من التمثیل الکوني 
جدول ۳۳: فئة السات التركيبية 
جدول ۳4: قياس أداة محلل ستانفورد التركيبي 
جدول ۳۵: فئة السیات النحوية الوظيفية 
جدول TA‏ تقييم النموذج التركيبي الإحصائي 
جدول ۳۷: تقييم النموذج التركيبي .. حال إدخال النص معنوتًا آليا 
جدول ۳۸: وضع coe JI‏ في بنية جدولية 
جدول ٩‏ ۳: نموذج لمخرجات آلية استخلاص السات 
جدول :5٠‏ نموذج لخرجات آلية التصنيف الآلي لجملة» تتواصل الحرب...» 
جدول EY‏ تحديد الفئات النحوية الوظيفية دون السات في خرجات آلية التصنيف 
جدول ٤١‏ : إحصائيات النموذج النحوي الإحصائي وتقييمه 


جدول 4۳ : تقييم النموذج النحوي المتكامل 


4 


الصفحة 


۱5۰ 


هذه ا لطبعة 
اهداء من الرکز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


الا ختصارات الستخدمة 


POS Parts Of Speech آقسام الکلام‎ 
TOSCA Tools for Syntactic Corpus Analysis | آدو ات تحلیل الدونة النحوية‎ 
1 Information Retrieval استرجاع العلومات‎ 
DT Decision Trees مشجٌرات اتخاذ القرار‎ 
مالآ‎ Universal Dependencies الاعت‌ادیات العالية‎ 
FSM Finite-State Machines الحدودة‎ JULI آلات‎ 
m Quranic Arabic Dependency البنك الاعت‌ادی للنص‎ 
0 Treebank القرآن‎ 
PDTB Prague dependency Treebank الاعت‌ادي‎ e NI 
PTB Penn Treebank بنك بنسلفانیا الشجري‎ 


= 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 
أو تداولها تجاریا 


الدلالي للغة الايطالية 
بنك کولومبیا الشجري للغة 
العربية 
البنية الاعت‌ادية 
تحويل النص المكتوب إلى 
منطوق 
الترجة الآلية 
الترحمة الآلية الإحصائية 
التعرف على كينونة الاسم 
تعريفات نوع الوثيقة 
التعلم JI‏ 
تغطية للاستعالات 


الإنجليزية 


جمعية اللسانيات الحاسوبية 


جواب السؤال 


الحقول العشوائية المشروطة 


خوارزمية التحليل من أسفل 
لأعلى 


Treebank 
Italian Syntactic-Semantic Treebank 
The Columbia Arabic Treebank 
Dependency Structure 
Text to speech 
Machine Translation 
Statistical Machine Translation 
Regular expression 
Named Entity Recognation 
Document Type Definitions 
Machine Learning 


The Survey Of English Usage 


The Association for Computational 


Linguistics 


Question Answering 


Conditional Random 
Fields 


Cocke-Younger-Kasami algorithm 


= 


TB 


ISST 


CATiB 


DS 


TTS 


MT 


SMT 


Regex 


NER 


DTD 


ML 


SUE 


ACL 


QA 


CRF 


CYK 


هذه الطبعة 
إهداء من المركز 
ولايسمح بنشرها ورقياً 
أو تداولها تجارياً 


النحو الاحتملي المتحرر من 
السیاق 


الذکاء الا صطناعي 
الربط الخطابي 
رخصة جنو العمومية 
شبكة البيانات اللغوية 
شبكة كلمات برنستون 


صيغة تحويل نظام الحروف 
الدولي الموخد بقوة ۸ بت 


صيغة صفحة التشفير ۱۳۹ 
علم اللغة الحاسوبي 
الفئة الكلامية المقلصة 
فك اللبس الدلالي للكلمات 
فهم اللغة الطبيعية 
لغة الترميز القابلة للامتداد 
المدونة الإنجليزية المنطوقة 
المدونة التاريخية الموصفة للغة 
الأيسلندية 
مدونة ed‏ لندن 


Probabilistic Context-Free 


Grammars 


Artificial Intelligence 


discourse connective 


GNU General Public License 


Linguistic Data Consortium 


WordNet Princeton 


Unicode Transformation Format 
bit-8 


Chomsky normal form 


Code page ۹۲ 


Computational Linguistics 


Reduced Tagset 


Word Sense Disambiguation 


Natural Language Understanding 


Extensible Markup Language 


Spoken English Corpus 


Icelandic Parsed Historical Corpus 


London-Lund Corpus 


-Yav- 


PCFG 


AI 


DC 


GPL 


LDC 


PWN 


UTF-8 


CNF 


0-۱۰۰ 


CL 


RTS 


WSD 


NLU 


XML 


SEC 


IcePaHC 


LLC 


المدوئة المعدونة lige‏ 


محلل باكولتر الصرفي للغة 
العربية 


معالحة اللغة الطبيعية 
نحوية للعربية 


معهد ماساتشو M‏ 5 للتقنية 


التظمة الدولية للمعاییر 
القياسية 


منظمة العلوم والدفاع 
موتر تعليم اللغة الطبيعية 
النحو الكلي 

نماذح ماركوف الخفية 


وحدة أبحاث حوسبة اللغة 


الإنجليزية 


وسيط 


المدونة الوطنية البريطانية 


مركز أنظمة التعلم احاسويي 


هذه الطبعة 
إهداء من المركز 
ولایسمح بنشرها ورقيا 

أو تداولها تجاریا 


الصطلح بالانجليزية 


Syntactically Annotated Corpus 


The British National Corpus 


Center for Computational Learning 
Systems 

Buckwalter Arabic Morphological 
Analyzer 


Natural Language Processing 


Arabic Morphosyntactic Tagger 


Massachusetts Institute of 


Technology 


International Organization for 


.Standardization 


Defence Science Organisation 


The Conference on Natural 


Language Learning 
Universal Grammar 
Hidden Markov Models 


Unit for Computer Research on the 
English Language 


Argument 


SAC 


BNC 


CCLS 


BAMA 


NLP 


AMT 


MIT 


ISO 


DSO 


CoNLL 


UG 


HMM 


UCREL 


A 


الرسائل الجامعية ع 


البنك الشجري النحوي 


يعمل مركز اللك عبداللّه بن عبدالعزیز الدولي لخدمة اللغة العربية على تعزیز خدماته في الجالات التنوعة لخدمة 
اللغة العربية وعلومهاء إذ ینطلق من رؤية 342-52 في آعماله عامة - ومنها برنامج النشر — وذلك بأن یطلق برامجه 
ودراساته 2 الجالات التي تفتقر إلى جهود نوعية. أو التي تحتاج إلى تکثیف العمل فیها. 

ويجتهد الرکز في انتقاء الکتب التي تصدر ضمن هذه السلسلة. بأن تکون مضيفة إلى حقلها العرفي. ومفتاحا 
للمشروعات العلمية والعملية. ومحققة قة لتراكم معرفي مثر. 

وإذ تشيد الأمانة العامة في المركز بجهد مؤلف الكتاب» تأليفاً. وتصحيحاً لمسوداته. ومراجعةً للطباعةء فإنها تدعو 
الباحثين كافة من آنحاء العالم إلى المساهمة في هذه السلسة. لتتكامل مع سلاسل المركز العلمية الأخرى. 

ويسعد المركز بالعمل مع المؤسسات والأفراد المختصين والمهتمين في خدمة لغتنا العربية. وتكثيف الجهود والتكامل نحو 


تمكيق لفتتاء وتحقيق وجودها السامى فى مجالات الحياة: 


هذه الطبعة 
اهداء من الرکز 
ولایسمح بنشرها Las‏ 
أو تداولها تجاریا 


O‏ مرکز الملك عبدالته بن عبدالعزيز الدولي 
42 لخدمة اللغة العربية 
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